In [1]:
import os, sys
import unidecode
import re
import json
import gc

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Ce notebook analyse les réponses aux questions en cherchant des liens entre les mots les plus utilisés, dans le but de comprendre les demandes les plus récurrentes des francais.

Dans un premier temps, les réponses sont préprocessées et transformées en liste de mots-clés. Puis, pour chaque réponse, úne analyse basique de la proximité des mots est réalisée. Bien que simple, cette methode permet de faire apparaitre des thèmes récurrents et de comprendre la teneur générale de ces demandes.

Les trois métriques utilisées sont :
+ co-occurence des mots : $co-occurence(i, j) = \sum_{users} 1_{i \in user} 1_{j \in user}$
+ confiance : $confiance(i -> j) = P(j | i)$
+ lift : $lift(i, j) = \frac{P(i \cap j)}{P(i)P(j)}$

La co-occurence permet d'évaluer les mots présents de manière commune, et donne une première idée des thèmes généraux.

La confiance donne une idée de la présence de $j$ quand $i$ est déjà présent : il surpondère les mots peu présents par rapport à la co-occurence.

Le lift estime le surplus de présence commune de $i$ et $j$ par rapport au cas où $i$ et $j$ sont indépendants. Cela permet de trouver des relations de causalité plus intéressantes, notamment dans des cas où certains mots sont peu présents mais très liés.

Pour chaque question :
+ On récupère les mots les plus employés sur ce thème
+ Pour chacun de ces mots, on regarde pour chaque métrique les mots les plus liés, ce qui donne une bonne idée des liens et des demandes

On peut ensuite raffiner l'analyse sur des mots moins présents mais porteurs de sens.

In [2]:
# function definitions

def compute_similarities(question_name, df_res):
    qu = df_res[question_name].dropna()
    df_qu_one_hot = compute_one_hot(qu)
    df_cov = compute_covariance(df_qu_one_hot)
    df_confidence = compute_confidence(df_cov)
    df_lift = compute_lift(df_cov, df_qu_one_hot)
    
    return qu, df_qu_one_hot, df_cov, df_confidence, df_lift
    
def compute_one_hot(qu):
    qu_words = []
    for i in qu:
        qu_words.extend(i)
    qu_words = list(set(qu_words))
    dic_qu_words = {word:i for i, word in enumerate(qu_words)}
    dic_qu_words_inverse = {i:word for i, word in enumerate(qu_words)}
    
    qu_one_hot = np.zeros((len(qu), len(qu_words)), dtype=bool)
    for i, li_word in enumerate(qu):
        for word in li_word:
            qu_one_hot[i, dic_qu_words[word]] = True
            
    df_qu_one_hot = pd.DataFrame(columns=qu_words, data=qu_one_hot).to_sparse(fill_value=False)

    
    temp_mask = np.sum(df_qu_one_hot.values, axis=0, dtype=np.uint16) > 250
    words_enough = df_qu_one_hot.columns.values[temp_mask]
    df_qu_one_hot = df_qu_one_hot[words_enough].to_sparse(fill_value=0)
    
    del temp_mask
    del qu_one_hot
    gc.collect()
    
    return df_qu_one_hot

def compute_covariance(df_qu_one_hot):
    N = df_qu_one_hot.shape[1]
    
    cov = np.zeros((N, N), dtype=np.uint16)
    np.matmul(df_qu_one_hot.values.T, df_qu_one_hot.values, out=cov)
    
    df_cov = pd.DataFrame(columns=df_qu_one_hot.columns, index=df_qu_one_hot.columns, data=cov) * (cov > 100)
    del cov
    gc.collect()
    
    return df_cov

def compute_confidence(df_cov):
    df_confidence = np.diag(1 / np.diag(df_cov)).dot(df_cov).astype(np.float32)
    df_confidence = pd.DataFrame(index=df_cov.index, columns=df_cov.index, data=df_confidence)
    return df_confidence

def compute_lift(df_cov, df_qu_one_hot):
    inv_diag_cov = 1 / np.diag(df_cov.values)
    lift = inv_diag_cov.reshape((-1, 1)) * df_cov.values * inv_diag_cov.reshape((1, -1))
    df_lift = pd.DataFrame(columns=df_qu_one_hot.columns,
                             index=df_qu_one_hot.columns,
                             data=lift).replace(0.0, np.nan).astype(np.float32)
    del lift
    del inv_diag_cov
    gc.collect()
    
    return df_lift

# Loading of files and preprocessing

In [3]:
PATH_TO_FILE = "./proposals_cleaned/services.json"

In [4]:
with open(PATH_TO_FILE, "r") as f:
    raw_json = [s.strip() for s in f.readlines()]
    
parsed_json = [json.loads(raw_json[i]) for i in range(len(raw_json))]
del raw_json

In [5]:
col = ["titre"]
for ques in parsed_json[0]["responses"]:
    col.append(ques["question"]["id"]) 
        
data = []
for elt in parsed_json:
    resp = {"titre" : elt["titre"]}
    for ques in elt["responses"]:
        if ques["question"]["title"] == "Si oui, comment ?":
            if ques["question"]["id"] == "185":
                ques["question"]["title"] += "_terrain"
            else:
                ques["question"]["title"] += "_admin"
        try:
            text = json.loads((ques["value"]))
            resp[ques["question"]["title"]] = ''
            if text["labels"] != []:
                resp[ques["question"]["title"]] += ", ".join(text["labels"])
            if text["other"] is not None:
                resp[ques["question"]["title"]] += ", " + text["other"]
            if resp[ques["question"]["title"]] == '':
                resp[ques["question"]["title"]] = np.nan
        except:
            if ques["value"] is not None and ques["value"][0] != "{":
                resp[ques["question"]["title"]] = ques["value"]
            else:
                resp[ques["question"]["title"]] = np.nan
    data.append(resp)

In [6]:
res = pd.DataFrame.from_dict(data)
del data
gc.collect()

0

In [7]:
res.notna().mean(axis=0).sort_values(ascending=False)

titre                                                                                                                                                                                                                                 1.000000
Estimez-vous avoir accès aux services publics dont vous avez besoin ?                                                                                                                                                                 0.720851
Que pensez-vous de l'organisation de l'Etat et des administrations en France ? De quelle manière cette organisation devrait-elle évoluer ?                                                                                            0.712880
Connaissez-vous le "droit à l'erreur", c'est-à-dire le droit d'affirmer votre bonne foi lorsque vous faites un erreur dans vos déclarations ?                                                                                         0.696867
Avez-vous déjà utilisé certaines de ces nouv

# Find important words

In [8]:
li_word_count = []
for elt in res.values:
    for item in elt:
        if type(item) == str:
            li_word_count.extend([unidecode.unidecode(x.lower()) for x in re.findall(r'\w+', item)])

In [9]:
dic_word_count = {}
for i in li_word_count:
    if len(i) > 0:
        if i in dic_word_count.keys():
            dic_word_count[i] +=1
        else:
            dic_word_count[i] = 1

In [10]:
df_word_count = pd.DataFrame.from_dict(dic_word_count, orient="index")
df_word_count.sort_values(0, ascending=False)
df_word_count.columns = ["freq_in_debate"]

In [11]:
del li_word_count
del dic_word_count

gc.collect()

202

In [12]:
df_word_count = df_word_count[df_word_count["freq_in_debate"] > 100]

In [13]:
li_stopwords = [unidecode.unidecode(x.strip().lower()) for x in open("french_stopwords.txt", 'r').readlines()]
li_stopwords = set(li_stopwords)
li_stopwords.remove("aucun")
li_stopwords.remove("tout")
li_stopwords.remove("tous")
li_stopwords.remove("non")

In [14]:
new_data = []
for i, elt in enumerate(res.index):
    temp_res = []
    for col in res.columns:
        item = res.loc[elt, col]
        if type(item) == str:
            li_item = [unidecode.unidecode(x.lower()) for x in re.findall(r'\w+', item) if unidecode.unidecode(x.lower()) not in li_stopwords]
            temp_res.append(li_item)
        else:
            temp_res.append(None)
    new_data.append(temp_res)

In [15]:
new_res = pd.DataFrame(new_data, columns=res.columns).to_sparse()
del new_data
gc.collect()

0

# Question 1 :   Que pensez-vous de l'organisation de l'Etat et des administrations en France ? De quelle manière cette organisation devrait-elle évoluer ?

In [16]:
question_1 = "Que pensez-vous de l'organisation de l'Etat et des administrations en France ? De quelle manière cette organisation devrait-elle évoluer ?"
qu_1,df_qu_1_one_hot,df_cov_1,df_confidence_1,df_lift_1 = compute_similarities(question_1,new_res)

In [17]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_1[i].sort_values(ascending=False).head(10))

faut


faut         5247
faire        1471
tout         1428
citoyens     1036
services      997
supprimer     973
service       968
temps         862
communes      853
nombre        843
Name: faut, dtype: uint16

services


services           4100
publics            1310
faut                997
faire               806
tous                791
tout                760
service             726
administrations     676
fonctionnaires      671
communes            662
Name: services, dtype: uint16

faire


faire       3891
faut        1471
tout        1360
citoyens    1020
service      897
temps        897
francais     808
services     806
tous         800
mettre       734
Name: faire, dtype: uint16

tout


tout         3716
faut         1428
faire        1360
citoyens      966
service       895
temps         873
francais      815
tous          773
services      760
politique     719
Name: tout, dtype: uint16

communes


communes        3386
regions         1399
departements    1305
supprimer        992
region           855
faut             853
communautes      846
nombre           838
departement      834
commune          749
Name: communes, dtype: uint16

organisation


organisation       3329
faut                775
administrations     709
services            656
faire               595
tout                542
communes            506
regions             497
citoyens            492
nombre              491
Name: organisation, dtype: uint16

fonctionnaires


fonctionnaires     3217
nombre              871
hauts               802
faut                767
faire               680
services            671
tous                599
tout                575
supprimer           561
administrations     522
Name: fonctionnaires, dtype: uint16

administrations


administrations    3184
organisation        709
faut                692
services            676
faire               564
fonctionnaires      522
tout                498
citoyens            489
administration      464
nombre              415
Name: administrations, dtype: uint16

nombre


nombre            3101
reduire            955
fonctionnaires     871
faut               843
communes           838
deputes            761
elus               734
supprimer          715
faire              686
regions            632
Name: nombre, dtype: uint16

supprimer


supprimer         3086
communes           992
faut               973
regions            812
departements       786
nombre             715
fonctionnaires     561
departement        549
faire              537
services           523
Name: supprimer, dtype: uint16

regions


regions         3041
communes        1399
departements    1344
supprimer        812
faut             792
nombre           632
departement      582
faire            549
region           546
services         525
Name: regions, dtype: uint16

citoyens


citoyens     2999
faut         1036
faire        1020
tout          966
service       861
francais      670
temps         659
politique     644
services      624
mettre        607
Name: citoyens, dtype: uint16

tous


tous              2786
faire              800
faut               796
services           791
tout               773
nombre             614
fonctionnaires     599
citoyens           586
non                575
france             521
Name: tous, dtype: uint16

administration


administration     2607
faut                605
services            593
faire               527
fonctionnaires      491
organisation        475
tout                470
administrations     464
citoyens            403
tous                397
Name: administration, dtype: uint16

service


service     2523
faut         968
faire        897
tout         895
public       874
citoyens     861
services     726
temps        654
mettre       605
francais     603
Name: service, dtype: uint16

elus


elus              2267
nombre             734
communes           617
faut               541
faire              530
tous               505
fonctionnaires     503
regions            487
tout               483
citoyens           476
Name: elus, dtype: uint16

departements


departements    2187
regions         1344
communes        1305
supprimer        786
faut             559
nombre           519
region           483
suppression      437
communautes      415
elus             397
Name: departements, dtype: uint16

france


france          2147
faut             651
faire            620
tout             581
tous             521
nombre           484
pays             473
organisation     471
services         451
regions          450
Name: france, dtype: uint16

non


non               2118
faire              707
tout               610
faut               605
tous               575
services           514
fonctionnaires     476
nombre             470
citoyens           467
elus               422
Name: non, dtype: uint16

region


region          2068
departement     1098
communes         855
commune          744
regions          546
faut             530
supprimer        496
departements     483
nombre           421
services         414
Name: region, dtype: uint16

In [18]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_1[i].sort_values(ascending=False).head(10))

faut


faut           1.000000
probants       0.997608
flashent       0.995169
rallonges      0.992840
biaisee        0.990499
colles         0.988152
rives          0.987952
abaissement    0.983871
injustement    0.981265
detourner      0.976359
Name: faut, dtype: float32

services


services      1.000000
publics       0.792019
publiques     0.497613
hopitaux      0.483412
acces         0.469242
qualite       0.455157
sociaux       0.452107
transports    0.431611
zones         0.423676
proximite     0.405900
Name: services, dtype: float32

faire


faire        1.000000
flashent     0.983092
racket       0.976415
rives        0.975904
probants     0.973684
colles       0.971564
biaisee      0.971496
rallonges    0.971360
compteur     0.968900
detourner    0.966903
Name: faire, dtype: float32

tout


tout           1.000000
flashent       0.997585
colles         0.983412
rallonges      0.983294
probants       0.983254
biaisee        0.978622
rives          0.978313
injustement    0.974239
racket         0.971698
trajet         0.965596
Name: tout, dtype: float32

communes


communes             1.000000
communautes          0.891465
petites              0.727273
communaute           0.718141
habitants            0.663576
intercommunalites    0.646003
fusionner            0.624585
regroupement         0.613592
metropoles           0.607438
fusion               0.596774
Name: communes, dtype: float32

organisation


organisation      1.000000
actuelle          0.506622
centralisee       0.418552
territoriale      0.380631
evoluer           0.378029
administrative    0.333817
lourde            0.318542
complexe          0.298405
evolution         0.292343
bonne             0.284389
Name: organisation, dtype: float32

fonctionnaires


fonctionnaires    1.000000
hauts             0.908267
territoriaux      0.554913
payes             0.497159
statut            0.481061
remuneration      0.425926
salaires          0.418338
fonctionnaire     0.416404
prive             0.396417
train             0.378882
Name: fonctionnaires, dtype: float32

administrations


administrations    1.000000
usagers            0.287749
devraient          0.257609
internet           0.226716
besoins            0.225505
demarches          0.219065
pourraient         0.213080
organisation       0.212977
manque             0.211513
mal                0.205499
Name: administrations, dtype: float32

nombre


nombre            1.000000
diminution        0.597077
diminuer          0.592746
parlementaires    0.542793
senateurs         0.505263
mandats           0.501393
deputes           0.486884
reduire           0.484280
reduction         0.476839
cumul             0.475524
Name: nombre, dtype: float32

supprimer


supprimer            1.000000
fusionner            0.378738
senat                0.374700
intercommunalites    0.363785
garder               0.363248
renforcer            0.361702
departements         0.359396
departementaux       0.353383
echelon              0.353186
anciens              0.351598
Name: supprimer, dtype: float32

regions


regions              1.000000
departements         0.614540
metropoles           0.578512
intercommunalites    0.528548
fusion               0.518817
taille               0.505791
communautes          0.488936
autonomie            0.448468
grandes              0.430993
garder               0.414530
Name: regions, dtype: float32

citoyens


citoyens     1.000000
rives        0.992771
detourner    0.981087
biaisee      0.980998
compteur     0.980861
probants     0.980861
flashent     0.980676
rallonges    0.976134
colles       0.971564
racket       0.966981
Name: citoyens, dtype: float32

tous


tous        1.000000
6           0.474164
jours       0.464072
30          0.436860
revenus     0.430279
millions    0.429134
vivre       0.422311
4           0.421663
an          0.411960
enfants     0.407534
Name: tous, dtype: float32

administration


administration    1.000000
francaise         0.453252
entreprise        0.233051
lourde            0.226624
maniere           0.208556
part              0.203125
demande           0.201681
cout              0.200337
sociale           0.200000
besoin            0.198925
Name: administration, dtype: float32

service


service        1.000000
flashent       0.985507
rallonges      0.976134
probants       0.976077
colles         0.971564
biaisee        0.971496
injustement    0.969555
racket         0.969340
rives          0.968675
compteur       0.961722
Name: service, dtype: float32

elus


elus             1.000000
indemnites       0.529825
mandats          0.498607
cumul            0.489510
elu              0.480331
election         0.464883
mandat           0.456938
elections        0.424354
locaux           0.413013
representants    0.407692
Name: elus, dtype: float32

departements


departements         1.000000
intercommunalites    0.491028
metropoles           0.475207
regions              0.441960
communautes          0.437302
fusionner            0.411960
fusion               0.397849
metropole            0.386617
communes             0.385411
prefectures          0.332410
Name: departements, dtype: float32

france


france       1.000000
allemagne    0.448052
millions     0.440945
europe       0.405467
000          0.376168
enfants      0.345890
6            0.343465
pays         0.336895
grands       0.333333
10           0.320166
Name: france, dtype: float32

non


non        1.000000
6          0.410334
cumul      0.388112
enfants    0.376712
mandats    0.364902
mandat     0.356459
4          0.355899
30         0.354949
vote       0.352645
droit      0.347899
Name: non, dtype: float32

region


region              1.000000
departement         0.568617
metropole           0.561338
communaute          0.506747
commune             0.481553
intercommunalite    0.466934
departemental       0.318627
nouvelle            0.289694
collectivite        0.289398
maire               0.286064
Name: region, dtype: float32

In [19]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_1[i].sort_values(ascending=False).head(10))

faut


faut           0.000191
probants       0.000190
flashent       0.000190
rallonges      0.000189
biaisee        0.000189
colles         0.000188
rives          0.000188
abaissement    0.000188
injustement    0.000187
detourner      0.000186
Name: faut, dtype: float32

services


services      0.000244
publics       0.000193
publiques     0.000121
hopitaux      0.000118
acces         0.000114
qualite       0.000111
sociaux       0.000110
transports    0.000105
zones         0.000103
proximite     0.000099
Name: services, dtype: float32

faire


faire        0.000257
flashent     0.000253
racket       0.000251
rives        0.000251
probants     0.000250
colles       0.000250
biaisee      0.000250
rallonges    0.000250
compteur     0.000249
detourner    0.000248
Name: faire, dtype: float32

tout


tout           0.000269
flashent       0.000268
colles         0.000265
rallonges      0.000265
probants       0.000265
biaisee        0.000263
rives          0.000263
injustement    0.000262
racket         0.000261
trajet         0.000260
Name: tout, dtype: float32

communes


communes             0.000295
communautes          0.000263
petites              0.000215
communaute           0.000212
habitants            0.000196
intercommunalites    0.000191
fusionner            0.000184
regroupement         0.000181
metropoles           0.000179
fusion               0.000176
Name: communes, dtype: float32

organisation


organisation      0.000300
actuelle          0.000152
centralisee       0.000126
territoriale      0.000114
evoluer           0.000114
administrative    0.000100
lourde            0.000096
complexe          0.000090
evolution         0.000088
bonne             0.000085
Name: organisation, dtype: float32

fonctionnaires


fonctionnaires    0.000311
hauts             0.000282
territoriaux      0.000172
payes             0.000155
statut            0.000150
remuneration      0.000132
salaires          0.000130
fonctionnaire     0.000129
prive             0.000123
train             0.000118
Name: fonctionnaires, dtype: float32

administrations


administrations    0.000314
usagers            0.000090
devraient          0.000081
internet           0.000071
besoins            0.000071
demarches          0.000069
pourraient         0.000067
organisation       0.000067
manque             0.000066
mal                0.000065
Name: administrations, dtype: float32

nombre


nombre            0.000322
diminution        0.000193
diminuer          0.000191
parlementaires    0.000175
senateurs         0.000163
mandats           0.000162
deputes           0.000157
reduire           0.000156
reduction         0.000154
cumul             0.000153
Name: nombre, dtype: float32

supprimer


supprimer            0.000324
fusionner            0.000123
senat                0.000121
intercommunalites    0.000118
garder               0.000118
renforcer            0.000117
departements         0.000116
departementaux       0.000115
echelon              0.000114
anciens              0.000114
Name: supprimer, dtype: float32

regions


regions              0.000329
departements         0.000202
metropoles           0.000190
intercommunalites    0.000174
fusion               0.000171
taille               0.000166
communautes          0.000161
autonomie            0.000147
grandes              0.000142
garder               0.000136
Name: regions, dtype: float32

citoyens


citoyens     0.000333
rives        0.000331
detourner    0.000327
biaisee      0.000327
probants     0.000327
compteur     0.000327
flashent     0.000327
rallonges    0.000325
colles       0.000324
racket       0.000322
Name: citoyens, dtype: float32

tous


tous        0.000359
6           0.000170
jours       0.000167
30          0.000157
revenus     0.000154
millions    0.000154
vivre       0.000152
4           0.000151
an          0.000148
enfants     0.000146
Name: tous, dtype: float32

administration


administration    0.000384
francaise         0.000174
entreprise        0.000089
lourde            0.000087
maniere           0.000080
part              0.000078
demande           0.000077
cout              0.000077
sociale           0.000077
besoin            0.000076
Name: administration, dtype: float32

service


service        0.000396
flashent       0.000391
rallonges      0.000387
probants       0.000387
colles         0.000385
biaisee        0.000385
injustement    0.000384
racket         0.000384
rives          0.000384
compteur       0.000381
Name: service, dtype: float32

elus


elus             0.000441
indemnites       0.000234
mandats          0.000220
cumul            0.000216
elu              0.000212
election         0.000205
mandat           0.000202
elections        0.000187
locaux           0.000182
representants    0.000180
Name: elus, dtype: float32

departements


departements         0.000457
intercommunalites    0.000225
metropoles           0.000217
regions              0.000202
communautes          0.000200
fusionner            0.000188
fusion               0.000182
metropole            0.000177
communes             0.000176
prefectures          0.000152
Name: departements, dtype: float32

france


france       0.000466
allemagne    0.000209
millions     0.000205
europe       0.000189
000          0.000175
enfants      0.000161
6            0.000160
pays         0.000157
grands       0.000155
10           0.000149
Name: france, dtype: float32

non


non        0.000472
6          0.000194
cumul      0.000183
enfants    0.000178
mandats    0.000172
mandat     0.000168
4          0.000168
30         0.000168
vote       0.000166
droit      0.000164
Name: non, dtype: float32

region


region              0.000484
departement         0.000275
metropole           0.000271
communaute          0.000245
commune             0.000233
intercommunalite    0.000226
departemental       0.000154
nouvelle            0.000140
collectivite        0.000140
maire               0.000138
Name: region, dtype: float32

In [20]:
gc.collect()

147

# Question 2 :  Selon vous, l'Etat doit-il aujourd'hui transférer de nouvelles missions aux collectivités territoriales ?

In [21]:
question_2 = "Selon vous, l'Etat doit-il aujourd'hui transférer de nouvelles missions aux collectivités territoriales ?"
qu_2,df_qu_2_one_hot,df_cov_2,df_confidence_2,df_lift_2 = compute_similarities(question_2,new_res)

In [22]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_2[i].sort_values(ascending=False).head(10))

oui


oui    14901
non        0
Name: oui, dtype: uint16

non


non    14111
oui        0
Name: non, dtype: uint16

In [23]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_2[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [24]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_2[i].sort_values(ascending=False).head(10))

oui


oui    0.000067
non         NaN
Name: oui, dtype: float32

non


non    0.000071
oui         NaN
Name: non, dtype: float32

In [25]:
gc.collect()

14

# Question 3 : Si oui, lesquelles ?

In [26]:
question_3 = "Si oui, lesquelles ?"
qu_3,df_qu_3_one_hot,df_cov_3,df_confidence_3,df_lift_3 = compute_similarities(question_3, new_res)

In [27]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_3[i].sort_values(ascending=False).head(10))

tout


tout             1879
regalien          319
concerne          245
collectivites     236
regions           226
faut              201
education         188
vie               179
territoire        177
faire             170
Name: tout, dtype: uint16

collectivites


collectivites    1695
territoriales     815
missions          422
locales           334
faut              263
tout              236
moyens            223
non               185
transferer        180
faire             176
Name: collectivites, dtype: uint16

missions


missions         1513
collectivites     422
regaliennes       286
territoriales     236
moyens            223
transferer        207
non               189
nouvelles         181
regions           176
tout              163
Name: missions, dtype: uint16

regions


regions         1477
departements     262
communes         241
tout             226
education        220
gestion          189
missions         176
niveau           175
faut             175
region           167
Name: regions, dtype: uint16

education


education     1285
sante          398
nationale      251
regions        220
securite       193
tout           188
transports     179
culture        168
justice        168
police         148
Name: education, dtype: uint16

gestion


gestion          1220
routes            216
regions           189
vitesse           152
education         140
collectivites     124
territoire        121
services          113
niveau            111
exemple           110
Name: gestion, dtype: uint16

faut


faut             958
collectivites    263
tout             201
regions          175
faire            169
missions         162
moyens           137
territoriales    136
niveau           127
donner           115
Name: faut, dtype: uint16

territoriales


territoriales    902
collectivites    815
missions         236
tout             144
faut             136
non              111
commune            0
proximite          0
cas                0
decisions          0
Name: territoriales, dtype: uint16

sante


sante         883
education     398
securite      164
transports    157
tout          135
regions       129
justice       119
services      115
territoire    105
france          0
Name: sante, dtype: uint16

territoire


territoire       881
amenagement      303
tout             177
regions          124
gestion          121
collectivites    111
sante            105
services         102
proximite          0
routes             0
Name: territoire, dtype: uint16

routes


routes        848
vitesse       351
gestion       216
exemple       135
80            121
limitation    116
tout          109
france          0
proximite       0
decisions       0
Name: routes, dtype: uint16

exemple


exemple          848
vitesse          167
collectivites    161
tout             160
routes           135
regions          132
80               123
gestion          110
km               106
niveau           105
Name: exemple, dtype: uint16

moyens


moyens           838
missions         223
collectivites    223
donner           186
faut             137
transferer       122
france             0
decisions          0
routes             0
gestion            0
Name: moyens, dtype: uint16

vitesse


vitesse        833
routes         351
limitations    298
limitation     242
exemple        167
gestion        152
80             138
km             126
communes         0
decisions        0
Name: vitesse, dtype: uint16

services


services         831
publics          249
collectivites    135
tout             133
regions          116
sante            115
tous             113
gestion          113
proximite        112
faut             106
Name: services, dtype: uint16

region


region         824
departement    178
regions        167
tout           122
niveau         109
gestion        108
commune        107
faut           103
missions       102
proximite        0
Name: region, dtype: uint16

non


non              815
missions         189
collectivites    185
regaliennes      117
tout             113
territoriales    111
faut             111
oui              105
routes             0
gestion            0
Name: non, dtype: uint16

niveau


niveau           802
local            180
regions          175
tout             162
national         142
collectivites    127
faut             127
missions         126
gestion          111
education        109
Name: niveau, dtype: uint16

faire


faire            782
collectivites    176
tout             170
faut             169
regions          115
citoyens         104
france             0
emploi             0
cas                0
decisions          0
Name: faire, dtype: uint16

securite


securite     775
routiere     301
education    193
sante        164
tout         153
justice      125
france         0
proximite      0
routes         0
gestion        0
Name: securite, dtype: uint16

In [28]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_3[i].sort_values(ascending=False).head(10))

tout


tout           1.000000
concerne       0.712209
regalien       0.635458
vie            0.389978
justice        0.309582
local          0.264591
citoyens       0.239631
faire          0.217391
territoires    0.215074
faut           0.209812
Name: tout, dtype: float32

collectivites


collectivites    1.000000
territoriales    0.903548
locales          0.505295
nouvelles        0.434932
transferer       0.330882
transfert        0.319202
donner           0.293307
competences      0.278992
missions         0.278916
faut             0.274530
Name: collectivites, dtype: float32

missions


missions         1.000000
nouvelles        0.619863
regaliennes      0.530612
transferer       0.380515
transfert        0.276808
moyens           0.266110
territoriales    0.261641
collectivites    0.248968
non              0.231902
locales          0.186082
Name: missions, dtype: float32

regions


regions         1.000000
departements    0.493409
communes        0.341844
pouvoir         0.256897
donner          0.222441
niveau          0.218204
competences     0.215126
region          0.202670
transferer      0.185662
faut            0.182672
Name: regions, dtype: float32

education


education     1.000000
nationale     0.590588
culture       0.475921
sante         0.450736
justice       0.412776
police        0.398922
defense       0.396947
securite      0.249032
transports    0.245542
formation     0.227099
Name: education, dtype: float32

gestion


gestion       1.000000
routes        0.254717
vitesse       0.182473
transports    0.146776
niveau        0.138404
territoire    0.137344
services      0.135981
region        0.131068
exemple       0.129717
regions       0.127962
Name: gestion, dtype: float32

faut


faut             1.000000
donner           0.226378
faire            0.216113
transferer       0.196691
citoyens         0.165899
moyens           0.163484
niveau           0.158354
collectivites    0.155162
territoriales    0.150776
communes         0.143262
Name: faut, dtype: float32

territoriales


territoriales    1.000000
collectivites    0.480826
missions         0.155981
faut             0.141962
non              0.136196
tout             0.076637
departement      0.000000
proximite        0.000000
cas              0.000000
decisions        0.000000
Name: territoriales, dtype: float32

sante


sante         1.000000
education     0.309728
justice       0.292383
transports    0.215364
securite      0.211613
services      0.138387
territoire    0.119183
regions       0.087339
tout          0.071847
france        0.000000
Name: sante, dtype: float32

territoire


territoire       1.000000
amenagement      0.750000
services         0.122744
sante            0.118913
gestion          0.099180
tout             0.094199
regions          0.083954
collectivites    0.065487
proximite        0.000000
routes           0.000000
Name: territoire, dtype: float32

routes


routes        1.000000
vitesse       0.421369
limitation    0.370607
80            0.348703
gestion       0.177049
exemple       0.159198
tout          0.058010
france        0.000000
proximite     0.000000
decisions     0.000000
Name: routes, dtype: float32

exemple


exemple          1.000000
km               0.358108
80               0.354467
vitesse          0.200480
routes           0.159198
niveau           0.130923
collectivites    0.094985
gestion          0.090164
regions          0.089370
tout             0.085152
Name: exemple, dtype: float32

moyens


moyens           1.000000
donner           0.366142
transferer       0.224265
missions         0.147389
faut             0.143006
collectivites    0.131563
france           0.000000
decisions        0.000000
routes           0.000000
gestion          0.000000
Name: moyens, dtype: float32

vitesse


vitesse        1.000000
limitations    0.853868
limitation     0.773163
km             0.425676
routes         0.413915
80             0.397695
exemple        0.196934
gestion        0.124590
communes       0.000000
decisions      0.000000
Name: vitesse, dtype: float32

services


services         1.000000
publics          0.747748
proximite        0.279302
tous             0.193825
sante            0.130238
territoire       0.115778
faut             0.110647
gestion          0.092623
collectivites    0.079646
regions          0.078538
Name: services, dtype: float32

region


region         1.000000
departement    0.446115
commune        0.359060
niveau         0.135910
regions        0.113067
faut           0.107516
gestion        0.088525
missions       0.067416
tout           0.064928
proximite      0.000000
Name: region, dtype: float32

non


non              1.000000
oui              0.242494
regaliennes      0.217069
missions         0.124917
territoriales    0.123060
faut             0.115866
collectivites    0.109145
tout             0.060138
routes           0.000000
gestion          0.000000
Name: non, dtype: float32

niveau


niveau       1.000000
national     0.471761
local        0.350195
faut         0.132568
region       0.132282
exemple      0.123821
regions      0.118483
gestion      0.090984
tout         0.086216
education    0.084825
Name: niveau, dtype: float32

faire


faire            1.000000
faut             0.176409
citoyens         0.159754
collectivites    0.103835
tout             0.090474
regions          0.077861
france           0.000000
emploi           0.000000
cas              0.000000
decisions        0.000000
Name: faire, dtype: float32

securite


securite     1.000000
routiere     0.756281
justice      0.307125
sante        0.185730
education    0.150195
tout         0.081426
france       0.000000
proximite    0.000000
routes       0.000000
gestion      0.000000
Name: securite, dtype: float32

In [29]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_3[i].sort_values(ascending=False).head(10))

tout


tout           0.000532
concerne       0.000379
regalien       0.000338
vie            0.000208
justice        0.000165
local          0.000141
citoyens       0.000128
faire          0.000116
territoires    0.000114
faut           0.000112
Name: tout, dtype: float32

collectivites


collectivites    0.000590
territoriales    0.000533
locales          0.000298
nouvelles        0.000257
transferer       0.000195
transfert        0.000188
donner           0.000173
competences      0.000165
missions         0.000165
faut             0.000162
Name: collectivites, dtype: float32

missions


missions         0.000661
nouvelles        0.000410
regaliennes      0.000351
transferer       0.000251
transfert        0.000183
moyens           0.000176
territoriales    0.000173
collectivites    0.000165
non              0.000153
locales          0.000123
Name: missions, dtype: float32

regions


regions         0.000677
departements    0.000334
communes        0.000231
pouvoir         0.000174
donner          0.000151
niveau          0.000148
competences     0.000146
region          0.000137
transferer      0.000126
faut            0.000124
Name: regions, dtype: float32

education


education     0.000778
nationale     0.000460
culture       0.000370
sante         0.000351
justice       0.000321
police        0.000310
defense       0.000309
securite      0.000194
transports    0.000191
formation     0.000177
Name: education, dtype: float32

gestion


gestion       0.000820
routes        0.000209
vitesse       0.000150
transports    0.000120
niveau        0.000113
territoire    0.000113
services      0.000111
region        0.000107
exemple       0.000106
regions       0.000105
Name: gestion, dtype: float32

faut


faut             0.001044
donner           0.000236
faire            0.000226
transferer       0.000205
citoyens         0.000173
moyens           0.000171
niveau           0.000165
collectivites    0.000162
territoriales    0.000157
communes         0.000150
Name: faut, dtype: float32

territoriales


territoriales    0.001109
collectivites    0.000533
missions         0.000173
faut             0.000157
non              0.000151
tout             0.000085
decision              NaN
securite              NaN
sais                  NaN
locales               NaN
Name: territoriales, dtype: float32

sante


sante         0.001133
education     0.000351
justice       0.000331
transports    0.000244
securite      0.000240
services      0.000157
territoire    0.000135
regions       0.000099
tout          0.000081
non                NaN
Name: sante, dtype: float32

territoire


territoire       0.001135
amenagement      0.000851
services         0.000139
sante            0.000135
gestion          0.000113
tout             0.000107
regions          0.000095
collectivites    0.000074
non                   NaN
decision              NaN
Name: territoire, dtype: float32

routes


routes        0.001179
vitesse       0.000497
limitation    0.000437
80            0.000411
gestion       0.000209
exemple       0.000188
tout          0.000068
non                NaN
decision           NaN
securite           NaN
Name: routes, dtype: float32

exemple


exemple          0.001179
km               0.000422
80               0.000418
vitesse          0.000236
routes           0.000188
niveau           0.000154
collectivites    0.000112
gestion          0.000106
regions          0.000105
tout             0.000100
Name: exemple, dtype: float32

moyens


moyens           0.001193
donner           0.000437
transferer       0.000268
missions         0.000176
faut             0.000171
collectivites    0.000157
non                   NaN
decision              NaN
securite              NaN
sais                  NaN
Name: moyens, dtype: float32

vitesse


vitesse        0.001200
limitations    0.001025
limitation     0.000928
km             0.000511
routes         0.000497
80             0.000477
exemple        0.000236
gestion        0.000150
non                 NaN
decision            NaN
Name: vitesse, dtype: float32

services


services         0.001203
publics          0.000900
proximite        0.000336
tous             0.000233
sante            0.000157
territoire       0.000139
faut             0.000133
gestion          0.000111
collectivites    0.000096
regions          0.000095
Name: services, dtype: float32

region


region         0.001214
departement    0.000541
commune        0.000436
niveau         0.000165
regions        0.000137
faut           0.000130
gestion        0.000107
missions       0.000082
tout           0.000079
non                 NaN
Name: region, dtype: float32

non


non              0.001227
oui              0.000298
regaliennes      0.000266
missions         0.000153
territoriales    0.000151
faut             0.000142
collectivites    0.000134
tout             0.000074
decision              NaN
securite              NaN
Name: non, dtype: float32

niveau


niveau       0.001247
national     0.000588
local        0.000437
faut         0.000165
region       0.000165
exemple      0.000154
regions      0.000148
gestion      0.000113
tout         0.000108
education    0.000106
Name: niveau, dtype: float32

faire


faire            0.001279
faut             0.000226
citoyens         0.000204
collectivites    0.000133
tout             0.000116
regions          0.000100
non                   NaN
decision              NaN
securite              NaN
sais                  NaN
Name: faire, dtype: float32

securite


securite     0.001290
routiere     0.000976
justice      0.000396
sante        0.000240
education    0.000194
tout         0.000105
non               NaN
decision          NaN
sais              NaN
locales           NaN
Name: securite, dtype: float32

In [30]:
gc.collect()

147

# Question 4 :  Estimez-vous avoir accès aux services publics dont vous avez besoin ?

In [31]:
question_4 = "Estimez-vous avoir accès aux services publics dont vous avez besoin ?"
qu_4,df_qu_4_one_hot,df_cov_4,df_confidence_4,df_lift_4 = compute_similarities(question_4, new_res)

In [32]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_4[i].sort_values(ascending=False).head(10))

oui


oui    21197
non        0
Name: oui, dtype: uint16

non


non    10000
oui        0
Name: non, dtype: uint16

In [33]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_4[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [34]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_4[i].sort_values(ascending=False).head(10))

oui


oui    0.000047
non         NaN
Name: oui, dtype: float32

non


non    0.0001
oui       NaN
Name: non, dtype: float32

In [35]:
gc.collect()

14

# Question 5 : Si non, quels types de services publics vous manquent dans votre territoire et qu'il est nécessaire de renforcer ?

In [36]:
question_5 = "Si non, quels types de services publics vous manquent dans votre territoire et qu'il est nécessaire de renforcer ?"
qu_5,df_qu_5_one_hot,df_cov_5,df_confidence_5,df_lift_5 = compute_similarities(question_5, new_res)

In [37]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_5[i].sort_values(ascending=False).head(10))

services


services    2891
publics     1197
acces        492
tous         449
sante        401
poste        386
faut         369
service      346
public       334
internet     323
Name: services, dtype: uint16

poste


poste         1466
services       386
impots         236
service        206
public         180
transports     169
publics        166
hopitaux       133
horaires       125
sante          122
Name: poste, dtype: uint16

service


service     1464
public       598
services     346
poste        206
acces        201
publics      189
faut         183
tout         173
sante        170
impots       167
Name: service, dtype: uint16

publics


publics       1421
services      1197
acces          275
transports     261
tous           245
faut           198
service        189
poste          166
public         165
tout           162
Name: publics, dtype: uint16

sante


sante         1257
services       401
medecins       171
service        170
transports     168
acces          159
publics        156
education      126
poste          122
public         121
Name: sante, dtype: uint16

acces


acces       1212
services     492
internet     277
publics      275
service      201
public       172
soins        163
sante        159
faut         149
tous         148
Name: acces, dtype: uint16

transports


transports    1147
commun         422
publics        261
services       238
poste          169
sante          168
acces          120
service        112
cas              0
identite         0
Name: transports, dtype: uint16

public


public      1028
service      598
services     334
poste        180
acces        172
publics      165
faut         138
tout         123
sante        121
faire        109
Name: public, dtype: uint16

internet


internet    968
services    323
acces       277
tout        205
service     162
publics     162
faire       152
tous        149
faut        122
poste       122
Name: internet, dtype: uint16

tous


tous        945
services    449
publics     245
internet    149
acces       148
service     142
faut        136
faire       123
tout        115
public      108
Name: tous, dtype: uint16

faut


faut        942
services    369
faire       246
publics     198
service     183
tout        156
acces       149
public      138
tous        136
internet    122
Name: faut, dtype: uint16

tout


tout        929
services    296
internet    205
service     173
faire       171
publics     162
faut        156
acces       147
public      123
tous        115
Name: tout, dtype: uint16

impots


impots      846
services    279
poste       236
service     167
centre      134
publics     110
caf         106
faut        106
communes      0
grise         0
Name: impots, dtype: uint16

faire


faire       825
services    277
faut        246
tout        171
service     159
internet    152
acces       129
publics     126
tous        123
poste       113
Name: faire, dtype: uint16

hopitaux


hopitaux     737
services     193
poste        133
publics      131
sante        121
medecins     110
proximite    102
cas            0
identite       0
grise          0
Name: hopitaux, dtype: uint16

medecins


medecins    666
sante       171
services    140
service     126
manque      124
hopitaux    110
ecoles        0
cas           0
identite      0
grise         0
Name: medecins, dtype: uint16

ville


ville        651
services     174
grande       164
habite       155
publics      107
km             0
identite       0
grise          0
emploi         0
proximite      0
Name: ville, dtype: uint16

manque


manque      644
services    208
service     135
medecins    124
publics     109
sante       101
ecoles        0
cas           0
identite      0
grise         0
Name: manque, dtype: uint16

proximite


proximite    611
services     257
publics      120
service      110
poste        108
hopitaux     102
sante        101
cas            0
identite       0
grise          0
Name: proximite, dtype: uint16

commun


commun        592
transports    422
transport     183
services      107
soins           0
communes        0
cas             0
identite        0
grise           0
emploi          0
Name: commun, dtype: uint16

In [38]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_5[i].sort_values(ascending=False).head(10))

services


services     1.000000
publics      0.842365
publiques    0.677852
citoyens     0.513793
maisons      0.496933
tous         0.475132
communes     0.456026
besoin       0.433071
villes       0.423611
proximite    0.420622
Name: services, dtype: float32

poste


poste         1.000000
impots        0.278960
mairie        0.277333
horaires      0.228519
hopital       0.207739
hopitaux      0.180461
proximite     0.176759
public        0.175097
transports    0.147341
service       0.140710
Name: poste, dtype: float32

service


service     1.000000
public      0.581712
exemple     0.239741
manque      0.209627
non         0.207792
impots      0.197400
faut        0.194268
faire       0.192727
medecins    0.189189
tout        0.186222
Name: service, dtype: float32

publics


publics       1.000000
services      0.414044
tous          0.259259
transports    0.227550
acces         0.226898
faut          0.210191
proximite     0.196399
horaires      0.193784
hopitaux      0.177748
tout          0.174381
Name: publics, dtype: float32

sante


sante         1.000000
education     0.448399
medecins      0.256757
proximite     0.165303
hopitaux      0.164179
manque        0.156832
transports    0.146469
services      0.138706
acces         0.131188
public        0.117704
Name: sante, dtype: float32

acces


acces       1.000000
soins       0.436997
internet    0.286157
publics     0.193526
horaires    0.184644
services    0.170183
public      0.167315
tout        0.158235
faut        0.158174
tous        0.156614
Name: acces, dtype: float32

transports


transports    1.000000
commun        0.712838
publics       0.183673
sante         0.133652
poste         0.115280
acces         0.099010
services      0.082324
service       0.076503
cas           0.000000
identite      0.000000
Name: transports, dtype: float32

public


public      1.000000
service     0.408470
faut        0.146497
acces       0.141914
tout        0.132400
faire       0.132121
poste       0.122783
publics     0.116115
services    0.115531
tous        0.114286
Name: public, dtype: float32

internet


internet     1.000000
demarches    0.274359
acces        0.228548
tout         0.220667
faire        0.184242
tous         0.157672
faut         0.129512
publics      0.114004
services     0.111726
service      0.110656
Name: internet, dtype: float32

tous


tous        1.000000
publics     0.172414
services    0.155310
internet    0.153926
faire       0.149091
faut        0.144374
tout        0.123789
acces       0.122112
public      0.105058
service     0.096995
Name: tous, dtype: float32

faut


faut        1.000000
faire       0.298182
tout        0.167922
tous        0.143915
publics     0.139338
public      0.134241
services    0.127637
internet    0.126033
impots      0.125296
service     0.125000
Name: faut, dtype: float32

tout


tout        1.000000
internet    0.211777
faire       0.207273
faut        0.165605
tous        0.121693
acces       0.121287
public      0.119650
service     0.118169
publics     0.114004
services    0.102387
Name: tout, dtype: float32

impots


impots      1.000000
centre      0.452703
caf         0.245940
poste       0.160982
service     0.114071
faut        0.112527
services    0.096506
publics     0.077410
communes    0.000000
grise       0.000000
Name: impots, dtype: float32

faire


faire        1.000000
demarches    0.276923
faut         0.261146
carte        0.233115
tout         0.184069
internet     0.157025
tous         0.130159
service      0.108607
acces        0.106436
public       0.106031
Name: faire, dtype: float32

hopitaux


hopitaux     1.000000
proximite    0.166939
medecins     0.165165
sante        0.096261
publics      0.092189
poste        0.090723
services     0.066759
cas          0.000000
identite     0.000000
grise        0.000000
Name: hopitaux, dtype: float32

medecins


medecins    1.000000
manque      0.192547
hopitaux    0.149254
sante       0.136038
service     0.086066
services    0.048426
ecoles      0.000000
cas         0.000000
identite    0.000000
grise       0.000000
Name: medecins, dtype: float32

ville


ville        1.000000
grande       0.571429
habite       0.432961
publics      0.075299
services     0.060187
km           0.000000
identite     0.000000
grise        0.000000
emploi       0.000000
proximite    0.000000
Name: ville, dtype: float32

manque


manque      1.000000
medecins    0.186186
service     0.092213
sante       0.080350
publics     0.076707
services    0.071947
ecoles      0.000000
cas         0.000000
identite    0.000000
grise       0.000000
Name: manque, dtype: float32

proximite


proximite    1.000000
hopitaux     0.138399
services     0.088897
publics      0.084448
sante        0.080350
service      0.075137
poste        0.073670
cas          0.000000
identite     0.000000
grise        0.000000
Name: proximite, dtype: float32

commun


commun        1.000000
transports    0.367916
transport     0.326786
services      0.037011
soins         0.000000
communes      0.000000
cas           0.000000
identite      0.000000
grise         0.000000
emploi        0.000000
Name: commun, dtype: float32

In [39]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_5[i].sort_values(ascending=False).head(10))

services


services     0.000346
publics      0.000291
publiques    0.000234
citoyens     0.000178
maisons      0.000172
tous         0.000164
communes     0.000158
besoin       0.000150
villes       0.000147
proximite    0.000145
Name: services, dtype: float32

poste


poste         0.000682
impots        0.000190
mairie        0.000189
horaires      0.000156
hopital       0.000142
hopitaux      0.000123
proximite     0.000121
public        0.000119
transports    0.000101
service       0.000096
Name: poste, dtype: float32

service


service     0.000683
public      0.000397
exemple     0.000164
manque      0.000143
non         0.000142
impots      0.000135
faut        0.000133
faire       0.000132
medecins    0.000129
tout        0.000127
Name: service, dtype: float32

publics


publics       0.000704
services      0.000291
tous          0.000182
transports    0.000160
acces         0.000160
faut          0.000148
proximite     0.000138
horaires      0.000136
hopitaux      0.000125
tout          0.000123
Name: publics, dtype: float32

sante


sante         0.000796
education     0.000357
medecins      0.000204
proximite     0.000132
hopitaux      0.000131
manque        0.000125
transports    0.000117
services      0.000110
acces         0.000104
public        0.000094
Name: sante, dtype: float32

acces


acces       0.000825
soins       0.000361
internet    0.000236
publics     0.000160
horaires    0.000152
services    0.000140
public      0.000138
tout        0.000131
faut        0.000131
tous        0.000129
Name: acces, dtype: float32

transports


transports    0.000872
commun        0.000621
publics       0.000160
sante         0.000117
poste         0.000101
acces         0.000086
services      0.000072
service       0.000067
non                NaN
caf                NaN
Name: transports, dtype: float32

public


public      0.000973
service     0.000397
faut        0.000143
acces       0.000138
tout        0.000129
faire       0.000129
poste       0.000119
publics     0.000113
services    0.000112
tous        0.000111
Name: public, dtype: float32

internet


internet     0.001033
demarches    0.000283
acces        0.000236
tout         0.000228
faire        0.000190
tous         0.000163
faut         0.000134
publics      0.000118
services     0.000115
service      0.000114
Name: internet, dtype: float32

tous


tous        0.001058
publics     0.000182
services    0.000164
internet    0.000163
faire       0.000158
faut        0.000153
tout        0.000131
acces       0.000129
public      0.000111
service     0.000103
Name: tous, dtype: float32

faut


faut        0.001062
faire       0.000317
tout        0.000178
tous        0.000153
publics     0.000148
public      0.000143
services    0.000135
internet    0.000134
impots      0.000133
service     0.000133
Name: faut, dtype: float32

tout


tout        0.001076
internet    0.000228
faire       0.000223
faut        0.000178
tous        0.000131
acces       0.000131
public      0.000129
service     0.000127
publics     0.000123
services    0.000110
Name: tout, dtype: float32

impots


impots      0.001182
centre      0.000535
caf         0.000291
poste       0.000190
service     0.000135
faut        0.000133
services    0.000114
publics     0.000092
non              NaN
securite         NaN
Name: impots, dtype: float32

faire


faire        0.001212
demarches    0.000336
faut         0.000317
carte        0.000283
tout         0.000223
internet     0.000190
tous         0.000158
service      0.000132
acces        0.000129
public       0.000129
Name: faire, dtype: float32

hopitaux


hopitaux     0.001357
proximite    0.000227
medecins     0.000224
sante        0.000131
publics      0.000125
poste        0.000123
services     0.000091
non               NaN
caf               NaN
securite          NaN
Name: hopitaux, dtype: float32

medecins


medecins    0.001502
manque      0.000289
hopitaux    0.000224
sante       0.000204
service     0.000129
services    0.000073
non              NaN
caf              NaN
securite         NaN
habite           NaN
Name: medecins, dtype: float32

ville


ville        0.001536
grande       0.000878
habite       0.000665
publics      0.000116
services     0.000092
non               NaN
caf               NaN
securite          NaN
telephone         NaN
carte             NaN
Name: ville, dtype: float32

manque


manque      0.001553
medecins    0.000289
service     0.000143
sante       0.000125
publics     0.000119
services    0.000112
non              NaN
caf              NaN
securite         NaN
habite           NaN
Name: manque, dtype: float32

proximite


proximite    0.001637
hopitaux     0.000227
services     0.000145
publics      0.000138
sante        0.000132
service      0.000123
poste        0.000121
non               NaN
caf               NaN
securite          NaN
Name: proximite, dtype: float32

commun


commun        0.001689
transports    0.000621
transport     0.000552
services      0.000063
non                NaN
caf                NaN
securite           NaN
habite             NaN
telephone          NaN
carte              NaN
Name: commun, dtype: float32

In [40]:
gc.collect()

285

# Question 6 : Quels nouveaux services ou quelles démarches souhaitez-vous voir développées sur Internet en priorité ?

In [41]:
question_6 = "Quels nouveaux services ou quelles démarches souhaitez-vous voir développées sur Internet en priorité ?"
qu_6,df_qu_6_one_hot,df_cov_6,df_confidence_6,df_lift_6 = compute_similarities(question_6, new_res)

In [42]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_6[i].sort_values(ascending=False).head(10))

internet


internet     4931
tout         1199
services     1148
demarches    1065
acces         871
faut          746
tous          714
faire         638
pouvoir       505
service       438
Name: internet, dtype: uint16

services


services     2667
internet     1148
tous          751
publics       667
acces         474
demarches     423
faut          405
tout          377
service       270
faire         244
Name: services, dtype: uint16

demarches


demarches          2401
internet           1065
administratives     710
services            423
faire               379
pouvoir             321
faut                308
tout                291
acces               270
tous                265
Name: demarches, dtype: uint16

tout


tout         2357
internet     1199
services      377
faire         371
faut          363
monde         357
acces         349
demarches     291
tous          212
service       205
Name: tout, dtype: uint16

tous


tous         1912
services      751
internet      714
acces         328
demarches     265
publics       219
tout          212
faut          208
service       178
faire         165
Name: tous, dtype: uint16

acces


acces        1557
internet      871
services      474
tout          349
tous          328
demarches     270
faut          247
service       159
publics       158
faire         147
Name: acces, dtype: uint16

faut


faut         1323
internet      746
services      405
tout          363
demarches     308
acces         247
faire         227
tous          208
service       174
publics       139
Name: faut, dtype: uint16

faire


faire        1227
internet      638
demarches     379
tout          371
pouvoir       263
services      244
faut          227
tous          165
ligne         154
service       152
Name: faire, dtype: uint16

service


service      1201
internet      438
public        391
services      270
tout          205
tous          178
faut          174
demarches     173
acces         159
faire         152
Name: service, dtype: uint16

aucun


aucun              1001
internet            269
demande               0
grise                 0
administratifs        0
accessible            0
cas                   0
agents                0
identite              0
administratives       0
Name: aucun, dtype: uint16

pouvoir


pouvoir      943
internet     505
demarches    321
faire        263
tout         195
services     184
devraient    158
tous         139
ligne        137
faut         117
Name: pouvoir, dtype: uint16

ligne


ligne             865
demarches         235
services          216
internet          164
tout              158
faire             154
pouvoir           137
tous              135
service           118
administratifs      0
Name: ligne, dtype: uint16

administratives


administratives    843
demarches          710
internet           298
services           110
pouvoir            108
faire              104
demande              0
identite             0
administratifs       0
accessible           0
Name: administratives, dtype: uint16

publics


publics            778
services           667
internet           355
tous               219
acces              158
faut               139
demarches          135
tout               135
ligne                0
administratives      0
Name: publics, dtype: uint16

carte


carte             733
identite          384
grise             357
passeport         229
internet          176
demarches         140
permis            130
services          113
administratifs      0
accessible          0
Name: carte, dtype: uint16

identite


identite          679
carte             384
passeport         230
papiers           126
permis            124
cartes            108
demarches         105
internet          104
demande             0
administratifs      0
Name: identite, dtype: uint16

exemple


exemple      648
internet     252
services     190
demarches    157
tout         144
faire        122
faut         117
tous         114
vote           0
besoin         0
Name: exemple, dtype: uint16

impots


impots       640
internet     195
services     155
demarches    131
tout         126
caf          104
publics        0
demarche       0
vote           0
proximite      0
Name: impots, dtype: uint16

numerique


numerique         603
tout              177
internet          176
services          142
faut              115
demarches         113
acces             103
identite            0
administratifs      0
accessible          0
Name: numerique, dtype: uint16

public


public            593
service           391
internet          237
services          183
tous              103
tout              103
faut              101
caf                 0
grise               0
administratifs      0
Name: public, dtype: uint16

In [43]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_6[i].sort_values(ascending=False).head(10))

internet


internet       1.000000
monde          0.775362
utiliser       0.737828
agees          0.681128
devraient      0.671642
accessibles    0.654237
accessible     0.626712
developper     0.610548
faudrait       0.603217
faut           0.563870
Name: internet, dtype: float32

services


services          1.000000
publics           0.857327
accessibles       0.511864
proximite         0.490842
developper        0.442191
tous              0.392782
administratifs    0.359322
faudrait          0.353887
devraient         0.350746
public            0.308600
Name: services, dtype: float32

demarches


demarches          1.000000
administratives    0.842230
devraient          0.542289
ensemble           0.399267
accessibles        0.379661
pouvoir            0.340403
faire              0.308883
ligne              0.271676
cas                0.259528
developper         0.257606
Name: demarches, dtype: float32

tout


tout          1.000000
monde         0.862319
accessible    0.345890
faire         0.302363
numerique     0.293532
temps         0.280654
faut          0.274376
cas           0.255898
internet      0.243156
agees         0.227766
Name: tout, dtype: float32

tous


tous           1.000000
accessibles    0.379661
accessible     0.356164
devraient      0.300995
services       0.281590
publics        0.281491
citoyens       0.220588
acces          0.210662
cas            0.206897
exemple        0.175926
Name: tous, dtype: float32

acces


acces       1.000000
monde       0.323671
agees       0.255965
citoyens    0.211397
publics     0.203085
cas         0.192377
faut        0.186697
services    0.177728
internet    0.176638
tous        0.171548
Name: acces, dtype: float32

faut


faut          1.000000
developper    0.267748
monde         0.251208
agees         0.221258
humain        0.219697
numerique     0.190713
faire         0.185004
exemple       0.180556
publics       0.178663
public        0.170320
Name: faut, dtype: float32

faire


faire              1.000000
pouvoir            0.278897
exemple            0.188272
ligne              0.178035
faut               0.171580
demarches          0.157851
tout               0.157403
internet           0.129386
service            0.126561
administratives    0.123369
Name: faire, dtype: float32

service


service     1.000000
public      0.659359
ligne       0.136416
faut        0.131519
faire       0.123879
acces       0.102119
services    0.101237
tous        0.093096
internet    0.088826
tout        0.086975
Name: service, dtype: float32

aucun


aucun              1.000000
internet           0.054553
demande            0.000000
grise              0.000000
administratifs     0.000000
accessible         0.000000
cas                0.000000
agents             0.000000
identite           0.000000
administratives    0.000000
Name: aucun, dtype: float32

pouvoir


pouvoir            1.000000
devraient          0.393035
faire              0.214344
ligne              0.158382
demarches          0.133694
administratives    0.128114
internet           0.102413
faut               0.088435
tout               0.082732
tous               0.072699
Name: pouvoir, dtype: float32

ligne


ligne             1.000000
pouvoir           0.145281
faire             0.125509
service           0.098251
demarches         0.097876
services          0.080990
tous              0.070607
tout              0.067034
internet          0.033259
administratifs    0.000000
Name: ligne, dtype: float32

administratives


administratives    1.000000
demarches          0.295710
pouvoir            0.114528
faire              0.084760
internet           0.060434
services           0.041245
demande            0.000000
identite           0.000000
administratifs     0.000000
accessible         0.000000
Name: administratives, dtype: float32

publics


publics      1.000000
services     0.250094
tous         0.114540
faut         0.105064
acces        0.101477
internet     0.071994
tout         0.057276
demarches    0.056227
proximite    0.000000
ligne        0.000000
Name: publics, dtype: float32

carte


carte             1.000000
grise             0.970109
passeport         0.596354
identite          0.565538
permis            0.316302
demarches         0.058309
services          0.042370
internet          0.035693
administratifs    0.000000
accessible        0.000000
Name: carte, dtype: float32

identite


identite          1.000000
passeport         0.598958
carte             0.523874
papiers           0.484615
cartes            0.304225
permis            0.301703
demarches         0.043732
internet          0.021091
demande           0.000000
administratifs    0.000000
Name: identite, dtype: float32

exemple


exemple            1.000000
faire              0.099430
faut               0.088435
services           0.071241
demarches          0.065389
tout               0.061095
tous               0.059623
internet           0.051105
ligne              0.000000
administratives    0.000000
Name: exemple, dtype: float32

impots


impots       1.000000
caf          0.351351
services     0.058118
demarches    0.054561
tout         0.053458
internet     0.039546
publics      0.000000
vote         0.000000
demarche     0.000000
proximite    0.000000
Name: impots, dtype: float32

numerique


numerique         1.000000
faut              0.086924
tout              0.075095
acces             0.066153
services          0.053243
demarches         0.047064
internet          0.035693
identite          0.000000
administratifs    0.000000
accessible        0.000000
Name: numerique, dtype: float32

public


public        1.000000
service       0.325562
faut          0.076342
services      0.068616
tous          0.053870
internet      0.048063
tout          0.043700
securite      0.000000
developper    0.000000
demarche      0.000000
Name: public, dtype: float32

In [44]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_6[i].sort_values(ascending=False).head(10))

internet


internet       0.000203
monde          0.000157
utiliser       0.000150
agees          0.000138
devraient      0.000136
accessibles    0.000133
accessible     0.000127
developper     0.000124
faudrait       0.000122
faut           0.000114
Name: internet, dtype: float32

services


services          0.000375
publics           0.000321
accessibles       0.000192
proximite         0.000184
developper        0.000166
tous              0.000147
administratifs    0.000135
faudrait          0.000133
devraient         0.000132
public            0.000116
Name: services, dtype: float32

demarches


demarches          0.000416
administratives    0.000351
devraient          0.000226
ensemble           0.000166
accessibles        0.000158
pouvoir            0.000142
faire              0.000129
ligne              0.000113
cas                0.000108
developper         0.000107
Name: demarches, dtype: float32

tout


tout          0.000424
monde         0.000366
accessible    0.000147
faire         0.000128
numerique     0.000125
temps         0.000119
faut          0.000116
cas           0.000109
internet      0.000103
agees         0.000097
Name: tout, dtype: float32

tous


tous           0.000523
accessibles    0.000199
accessible     0.000186
devraient      0.000157
services       0.000147
publics        0.000147
citoyens       0.000115
acces          0.000110
cas            0.000108
exemple        0.000092
Name: tous, dtype: float32

acces


acces       0.000642
monde       0.000208
agees       0.000164
citoyens    0.000136
publics     0.000130
cas         0.000124
faut        0.000120
services    0.000114
internet    0.000113
tous        0.000110
Name: acces, dtype: float32

faut


faut          0.000756
developper    0.000202
monde         0.000190
agees         0.000167
humain        0.000166
numerique     0.000144
faire         0.000140
exemple       0.000136
publics       0.000135
public        0.000129
Name: faut, dtype: float32

faire


faire              0.000815
pouvoir            0.000227
exemple            0.000153
ligne              0.000145
faut               0.000140
demarches          0.000129
tout               0.000128
internet           0.000105
service            0.000103
administratives    0.000101
Name: faire, dtype: float32

service


service     0.000833
public      0.000549
ligne       0.000114
faut        0.000110
faire       0.000103
acces       0.000085
services    0.000084
tous        0.000078
internet    0.000074
tout        0.000072
Name: service, dtype: float32

aucun


aucun         0.000999
internet      0.000054
non                NaN
numerique          NaN
caf                NaN
securite           NaN
developper         NaN
carte              NaN
impots             NaN
faudrait           NaN
Name: aucun, dtype: float32

pouvoir


pouvoir            0.001060
devraient          0.000417
faire              0.000227
ligne              0.000168
demarches          0.000142
administratives    0.000136
internet           0.000109
faut               0.000094
tout               0.000088
tous               0.000077
Name: pouvoir, dtype: float32

ligne


ligne        0.001156
pouvoir      0.000168
faire        0.000145
service      0.000114
demarches    0.000113
services     0.000094
tous         0.000082
tout         0.000077
internet     0.000038
non               NaN
Name: ligne, dtype: float32

administratives


administratives    0.001186
demarches          0.000351
pouvoir            0.000136
faire              0.000101
internet           0.000072
services           0.000049
non                     NaN
numerique               NaN
caf                     NaN
securite                NaN
Name: administratives, dtype: float32

publics


publics      0.001285
services     0.000321
tous         0.000147
faut         0.000135
acces        0.000130
internet     0.000093
tout         0.000074
demarches    0.000072
non               NaN
numerique         NaN
Name: publics, dtype: float32

carte


carte        0.001364
grise        0.001323
passeport    0.000814
identite     0.000772
permis       0.000432
demarches    0.000080
services     0.000058
internet     0.000049
non               NaN
numerique         NaN
Name: carte, dtype: float32

identite


identite     0.001473
passeport    0.000882
carte        0.000772
papiers      0.000714
cartes       0.000448
permis       0.000444
demarches    0.000064
internet     0.000031
non               NaN
numerique         NaN
Name: identite, dtype: float32

exemple


exemple      0.001543
faire        0.000153
faut         0.000136
services     0.000110
demarches    0.000101
tout         0.000094
tous         0.000092
internet     0.000079
non               NaN
numerique         NaN
Name: exemple, dtype: float32

impots


impots        0.001563
caf           0.000549
services      0.000091
demarches     0.000085
tout          0.000084
internet      0.000062
non                NaN
numerique          NaN
securite           NaN
developper         NaN
Name: impots, dtype: float32

numerique


numerique    0.001658
faut         0.000144
tout         0.000125
acces        0.000110
services     0.000088
demarches    0.000078
internet     0.000059
non               NaN
caf               NaN
securite          NaN
Name: numerique, dtype: float32

public


public       0.001686
service      0.000549
faut         0.000129
services     0.000116
tous         0.000091
internet     0.000081
tout         0.000074
non               NaN
numerique         NaN
caf               NaN
Name: public, dtype: float32

In [45]:
gc.collect()

147

# Question 7 :  Avez-vous déjà utilisé certaines de ces nouvelles formes de services publics ?

In [46]:
question_7 = "Avez-vous déjà utilisé certaines de ces nouvelles formes de services publics ?"
qu_7,df_qu_7_one_hot,df_cov_7,df_confidence_7,df_lift_7 = compute_similarities(question_7, new_res)

In [47]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_7[i].sort_values(ascending=False).head(10))

non


non    21522
oui        0
Name: non, dtype: uint16

oui


oui    8334
non       0
Name: oui, dtype: uint16

In [48]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_7[i].sort_values(ascending=False).head(10))

non


non    1.0
oui    0.0
Name: non, dtype: float32

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

In [49]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_7[i].sort_values(ascending=False).head(10))

non


non    0.000046
oui         NaN
Name: non, dtype: float32

oui


oui    0.00012
non        NaN
Name: oui, dtype: float32

In [50]:
gc.collect()

14

# Question 8 :  Si oui, en avez-vous été satisfait ?

In [51]:
question_8 = "Si oui, en avez-vous été satisfait ?"
qu_8,df_qu_8_one_hot,df_cov_8,df_confidence_8,df_lift_8 = compute_similarities(question_8, new_res)

In [52]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_8[i].sort_values(ascending=False).head(10))

oui


oui    6185
non       0
Name: oui, dtype: uint16

non


non    2994
oui       0
Name: non, dtype: uint16

In [53]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_8[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [54]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_8[i].sort_values(ascending=False).head(10))

oui


oui    0.000162
non         NaN
Name: oui, dtype: float32

non


non    0.000334
oui         NaN
Name: non, dtype: float32

In [55]:
gc.collect()

14

# Question 9 : Quelles améliorations préconiseriez-vous ?

In [56]:
question_9 = "Quelles améliorations préconiseriez-vous ?"
qu_9,df_qu_9_one_hot,df_cov_9,df_confidence_9,df_lift_9 = compute_similarities(question_9, new_res)

In [57]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_9[i].sort_values(ascending=False).head(10))

services


services      2579
publics       1125
public         410
maisons        375
service        316
tous           285
agents         268
faut           255
developper     249
faire          223
Name: services, dtype: uint16

publics


publics        1352
services       1125
agents          345
maisons         229
service         201
polyvalents     194
public          186
tous            159
faut            143
formes          143
Name: publics, dtype: uint16

service


service     1284
public       667
services     316
agents       204
publics      201
maisons      198
faut         166
faire        163
rendez       163
internet     140
Name: service, dtype: uint16

public


public      1072
service      667
services     410
maisons      285
agents       194
publics      186
faut         120
rendez       120
faire        116
communes       0
Name: public, dtype: uint16

agents


agents         1007
publics         345
polyvalents     293
services        268
service         204
public          194
formation       109
maisons         102
communes          0
bus               0
Name: agents, dtype: uint16

internet


internet     843
services     216
service      140
acces        135
tout         134
demarches    126
publics      115
faire        105
proximite      0
formation      0
Name: internet, dtype: uint16

faire


faire        792
services     223
service      163
faut         129
publics      127
demarches    118
public       116
tout         112
internet     105
pouvoir        0
Name: faire, dtype: uint16

faut


faut           760
services       255
service        166
publics        143
faire          129
public         120
tout           117
demarches        0
pouvoir          0
polyvalents      0
Name: faut, dtype: uint16

tout


tout         666
services     198
internet     134
faut         117
service      117
faire        112
publics      105
proximite      0
formation      0
bus            0
Name: tout, dtype: uint16

rendez


rendez       639
prise        208
service      163
services     129
public       120
formation      0
bus            0
tout           0
travail        0
publics        0
Name: rendez, dtype: uint16

demarches


demarches    586
services     140
internet     126
faire        118
public         0
proximite      0
formation      0
bus            0
tout           0
travail        0
Name: demarches, dtype: uint16

tous


tous         582
services     285
publics      159
public         0
agents         0
formation      0
bus            0
tout           0
travail        0
communes       0
Name: tous, dtype: uint16

maisons


maisons      548
services     375
public       285
publics      229
service      198
agents       102
proximite      0
formation      0
bus            0
tout           0
Name: maisons, dtype: uint16

developper


developper    545
services      249
publics       130
agents          0
personnel       0
formation       0
bus             0
tout            0
travail         0
communes        0
Name: developper, dtype: uint16

horaires


horaires     522
ouverture    166
services     119
agents         0
formation      0
bus            0
tout           0
travail        0
publics        0
communes       0
Name: horaires, dtype: uint16

acces


acces        435
services     165
internet     135
publics      107
public         0
agents         0
formation      0
bus            0
tout           0
travail        0
Name: acces, dtype: uint16

non


non           393
services      112
developper      0
proximite       0
personnel       0
formation       0
bus             0
tout            0
travail         0
publics         0
Name: non, dtype: uint16

prise


prise        377
rendez       208
service      106
public         0
formation      0
bus            0
tout           0
travail        0
publics        0
communes       0
Name: prise, dtype: uint16

formes


formes       373
services     169
publics      143
agents         0
personnel      0
formation      0
bus            0
tout           0
travail        0
communes       0
Name: formes, dtype: uint16

fonctionnaires


fonctionnaires    362
public              0
formation           0
bus                 0
tout                0
travail             0
publics             0
communes            0
proximite           0
agents              0
Name: fonctionnaires, dtype: uint16

In [58]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_9[i].sort_values(ascending=False).head(10))

services


services      1.000000
publics       0.832101
maisons       0.684307
bus           0.596958
lieu          0.556364
tous          0.489691
proximite     0.472313
developper    0.456881
formes        0.453083
place         0.411371
Name: services, dtype: float32

publics


publics        1.000000
polyvalents    0.555874
bus            0.460076
services       0.436216
maisons        0.417883
formes         0.383378
agents         0.342602
tous           0.273196
acces          0.245977
developper     0.238532
Name: publics, dtype: float32

service


service     1.000000
public      0.622202
maisons     0.361314
prise       0.281167
rendez      0.255086
faut        0.218421
faire       0.205808
agents      0.202582
tout        0.175676
internet    0.166074
Name: service, dtype: float32

public


public      1.000000
maisons     0.520073
service     0.519470
agents      0.192651
rendez      0.187793
services    0.158976
faut        0.157895
faire       0.146465
publics     0.137574
communes    0.000000
Name: public, dtype: float32

agents


agents         1.000000
polyvalents    0.839542
formation      0.416031
publics        0.255178
maisons        0.186131
public         0.180970
service        0.158879
services       0.103916
communes       0.000000
bus            0.000000
Name: agents, dtype: float32

internet


internet     1.000000
acces        0.310345
demarches    0.215017
tout         0.201201
faire        0.132576
service      0.109034
publics      0.085059
services     0.083753
proximite    0.000000
formation    0.000000
Name: internet, dtype: float32

faire


faire          1.000000
demarches      0.201365
faut           0.169737
tout           0.168168
service        0.126947
internet       0.124555
public         0.108209
publics        0.093935
services       0.086468
polyvalents    0.000000
Name: faire, dtype: float32

faut


faut         1.000000
tout         0.175676
faire        0.162879
service      0.129283
public       0.111940
publics      0.105769
services     0.098876
pouvoir      0.000000
personnel    0.000000
formation    0.000000
Name: faut, dtype: float32

tout


tout         1.000000
internet     0.158956
faut         0.153947
faire        0.141414
service      0.091121
publics      0.077663
services     0.076774
proximite    0.000000
formation    0.000000
bus          0.000000
Name: tout, dtype: float32

rendez


rendez       1.000000
prise        0.551724
service      0.126947
public       0.111940
services     0.050019
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
publics      0.000000
Name: rendez, dtype: float32

demarches


demarches    1.000000
internet     0.149466
faire        0.148990
services     0.054285
public       0.000000
proximite    0.000000
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
Name: demarches, dtype: float32

tous


tous         1.000000
publics      0.117604
services     0.110508
public       0.000000
agents       0.000000
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
communes     0.000000
Name: tous, dtype: float32

maisons


maisons      1.000000
public       0.265858
publics      0.169379
service      0.154206
services     0.145405
agents       0.101291
proximite    0.000000
formation    0.000000
bus          0.000000
tout         0.000000
Name: maisons, dtype: float32

developper


developper    1.000000
services      0.096549
publics       0.096154
agents        0.000000
personnel     0.000000
formation     0.000000
bus           0.000000
tout          0.000000
travail       0.000000
communes      0.000000
Name: developper, dtype: float32

horaires


horaires     1.000000
ouverture    0.566553
services     0.046142
agents       0.000000
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
publics      0.000000
communes     0.000000
Name: horaires, dtype: float32

acces


acces        1.000000
internet     0.160142
publics      0.079142
services     0.063978
public       0.000000
agents       0.000000
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
Name: acces, dtype: float32

non


non           1.000000
services      0.043428
developper    0.000000
proximite     0.000000
personnel     0.000000
formation     0.000000
bus           0.000000
tout          0.000000
travail       0.000000
publics       0.000000
Name: non, dtype: float32

prise


prise        1.000000
rendez       0.325509
service      0.082555
public       0.000000
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
publics      0.000000
communes     0.000000
Name: prise, dtype: float32

formes


formes       1.000000
publics      0.105769
services     0.065529
agents       0.000000
personnel    0.000000
formation    0.000000
bus          0.000000
tout         0.000000
travail      0.000000
communes     0.000000
Name: formes, dtype: float32

fonctionnaires


fonctionnaires    1.0
public            0.0
formation         0.0
bus               0.0
tout              0.0
travail           0.0
publics           0.0
communes          0.0
proximite         0.0
agents            0.0
Name: fonctionnaires, dtype: float32

In [59]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_9[i].sort_values(ascending=False).head(10))

services


services      0.000388
publics       0.000323
maisons       0.000265
bus           0.000231
lieu          0.000216
tous          0.000190
proximite     0.000183
developper    0.000177
formes        0.000176
place         0.000160
Name: services, dtype: float32

publics


publics        0.000740
polyvalents    0.000411
bus            0.000340
services       0.000323
maisons        0.000309
formes         0.000284
agents         0.000253
tous           0.000202
acces          0.000182
developper     0.000176
Name: publics, dtype: float32

service


service     0.000779
public      0.000485
maisons     0.000281
prise       0.000219
rendez      0.000199
faut        0.000170
faire       0.000160
agents      0.000158
tout        0.000137
internet    0.000129
Name: service, dtype: float32

public


public      0.000933
maisons     0.000485
service     0.000485
agents      0.000180
rendez      0.000175
services    0.000148
faut        0.000147
faire       0.000137
publics     0.000128
non              NaN
Name: public, dtype: float32

agents


agents         0.000993
polyvalents    0.000834
formation      0.000413
publics        0.000253
maisons        0.000185
public         0.000180
service        0.000158
services       0.000103
non                 NaN
developper          NaN
Name: agents, dtype: float32

internet


internet      0.001186
acces         0.000368
demarches     0.000255
tout          0.000239
faire         0.000157
service       0.000129
publics       0.000101
services      0.000099
non                NaN
developper         NaN
Name: internet, dtype: float32

faire


faire        0.001263
demarches    0.000254
faut         0.000214
tout         0.000212
service      0.000160
internet     0.000157
public       0.000137
publics      0.000119
services     0.000109
non               NaN
Name: faire, dtype: float32

faut


faut          0.001316
tout          0.000231
faire         0.000214
service       0.000170
public        0.000147
publics       0.000139
services      0.000130
non                NaN
developper         NaN
horaires           NaN
Name: faut, dtype: float32

tout


tout          0.001502
internet      0.000239
faut          0.000231
faire         0.000212
service       0.000137
publics       0.000117
services      0.000115
non                NaN
developper         NaN
horaires           NaN
Name: tout, dtype: float32

rendez


rendez        0.001565
prise         0.000863
service       0.000199
public        0.000175
services      0.000078
non                NaN
developper         NaN
horaires           NaN
impots             NaN
pouvoir            NaN
Name: rendez, dtype: float32

demarches


demarches     0.001706
internet      0.000255
faire         0.000254
services      0.000093
non                NaN
developper         NaN
horaires           NaN
impots             NaN
pouvoir            NaN
service            NaN
Name: demarches, dtype: float32

tous


tous          0.001718
publics       0.000202
services      0.000190
non                NaN
developper         NaN
horaires           NaN
impots             NaN
pouvoir            NaN
demarches          NaN
service            NaN
Name: tous, dtype: float32

maisons


maisons       0.001825
public        0.000485
publics       0.000309
service       0.000281
services      0.000265
agents        0.000185
non                NaN
developper         NaN
horaires           NaN
impots             NaN
Name: maisons, dtype: float32

developper


developper     0.001835
services       0.000177
publics        0.000176
non                 NaN
horaires            NaN
impots              NaN
pouvoir             NaN
demarches           NaN
service             NaN
polyvalents         NaN
Name: developper, dtype: float32

horaires


horaires       0.001916
ouverture      0.001085
services       0.000088
non                 NaN
developper          NaN
impots              NaN
pouvoir             NaN
demarches           NaN
service             NaN
polyvalents         NaN
Name: horaires, dtype: float32

acces


acces         0.002299
internet      0.000368
publics       0.000182
services      0.000147
non                NaN
developper         NaN
horaires           NaN
impots             NaN
pouvoir            NaN
demarches          NaN
Name: acces, dtype: float32

non


non            0.002545
services       0.000111
developper          NaN
horaires            NaN
impots              NaN
pouvoir             NaN
demarches           NaN
service             NaN
polyvalents         NaN
formes              NaN
Name: non, dtype: float32

prise


prise          0.002653
rendez         0.000863
service        0.000219
non                 NaN
developper          NaN
horaires            NaN
impots              NaN
pouvoir             NaN
demarches           NaN
polyvalents         NaN
Name: prise, dtype: float32

formes


formes        0.002681
publics       0.000284
services      0.000176
non                NaN
developper         NaN
horaires           NaN
impots             NaN
pouvoir            NaN
demarches          NaN
service            NaN
Name: formes, dtype: float32

fonctionnaires


fonctionnaires    0.002762
non                    NaN
developper             NaN
horaires               NaN
impots                 NaN
pouvoir                NaN
demarches              NaN
service                NaN
polyvalents            NaN
formes                 NaN
Name: fonctionnaires, dtype: float32

In [60]:
gc.collect()

294

# Question 10 : Quand vous pensez à l'évolution des services publics au cours des dernières années, quels sont ceux qui ont évolué de manière positive ?

In [61]:
question_10 = "Quand vous pensez à l'évolution des services publics au cours des dernières années, quels sont ceux qui ont évolué de manière positive ?"
qu_10,df_qu_10_one_hot,df_cov_10,df_confidence_10,df_lift_10 = compute_similarities(question_10, new_res)

In [62]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_10[i].sort_values(ascending=False).head(10))

impots


impots         5614
internet        775
service         751
services        637
ligne           514
declaration     470
securite        410
sociale         402
poste           396
site            267
Name: impots, dtype: uint16

services


services    3279
publics      989
impots       637
internet     536
fiscaux      448
tous         340
service      278
ligne        263
poste        255
public       236
Name: services, dtype: uint16

aucun


aucun          3024
services        225
service         171
tous            168
publics         136
tout            133
public          111
evolue            0
declaration       0
cpam              0
Name: aucun, dtype: uint16

internet


internet       2617
impots          775
services        536
demarches       501
acces           330
service         245
declaration     228
tout            226
faire           173
tous            173
Name: internet, dtype: uint16

service


service     1757
impots       751
public       491
services     278
internet     245
aucun        171
poste        157
ligne        146
publics      144
tout         135
Name: service, dtype: uint16

poste


poste          1537
impots          396
services        255
service         157
public          101
cartes            0
tout              0
publics           0
declaration       0
cpam              0
Name: poste, dtype: uint16

demarches


demarches          1232
internet            501
ligne               254
administratives     247
impots              246
services            174
faire               146
cpam                  0
pole                  0
declaration           0
Name: demarches, dtype: uint16

ligne


ligne          1212
impots          514
declaration     279
services        263
demarches       254
service         146
publics           0
tout              0
cpam              0
cartes            0
Name: ligne, dtype: uint16

publics


publics        1082
services        989
internet        159
tous            149
service         144
aucun           136
impots          123
evolution       118
public          102
degradation       0
Name: publics, dtype: uint16

tous


tous           974
services       340
internet       173
aucun          168
publics        149
impots         122
declaration      0
cpam             0
ligne            0
pole             0
Name: tous, dtype: uint16

public


public         967
service        491
tresor         302
services       236
impots         113
aucun          111
internet       103
publics        102
poste          101
degradation      0
Name: public, dtype: uint16

securite


securite           939
sociale            821
impots             410
services           146
service            104
pole                 0
identite             0
grise                0
administratives      0
emploi               0
Name: securite, dtype: uint16

sociale


sociale        874
securite       821
impots         402
services       139
publics          0
declaration      0
tout             0
cpam             0
degradation      0
ligne            0
Name: sociale, dtype: uint16

tout


tout           856
internet       226
services       180
impots         155
service        135
aucun          133
faire          107
publics          0
declaration      0
cpam             0
Name: tout, dtype: uint16

declaration


declaration        802
impots             470
ligne              279
internet           228
impot              133
emploi               0
agents               0
identite             0
grise                0
administratives      0
Name: declaration, dtype: uint16

administration


administration     710
fiscale            434
services           107
emploi               0
degradation          0
agents               0
identite             0
grise                0
administratives      0
pole                 0
Name: administration, dtype: uint16

carte


carte        701
grise        449
impots       249
identite     208
internet     151
passeport    142
services     111
ligne          0
cpam           0
evolue         0
Name: carte, dtype: uint16

evolution


evolution          692
positive           223
services           212
publics            118
internet           116
emploi               0
agents               0
identite             0
grise                0
administratives      0
Name: evolution, dtype: uint16

faire


faire          670
internet       173
services       165
demarches      146
impots         117
tout           107
service        102
publics          0
declaration      0
cpam             0
Name: faire, dtype: uint16

acces


acces          622
internet       330
services       190
impots         124
publics          0
declaration      0
cpam             0
ligne            0
pole             0
aucun            0
Name: acces, dtype: uint16

In [63]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_10[i].sort_values(ascending=False).head(10))

impots


impots         1.000000
gouv           0.678700
site           0.588106
declaration    0.586035
source         0.515254
sociale        0.459954
securite       0.436635
caf            0.430556
service        0.427433
ligne          0.424092
Name: impots, dtype: float32

services


services     1.000000
fiscaux      0.919918
publics      0.914048
publiques    0.394022
maniere      0.359133
tous         0.349076
evolue       0.346154
agents       0.335526
exemple      0.332609
positive     0.330629
Name: services, dtype: float32

aucun


aucun        1.000000
tous         0.172485
tout         0.155374
publics      0.125693
public       0.114788
service      0.097325
services     0.068618
securite     0.000000
carte        0.000000
numerique    0.000000
Name: aucun, dtype: float32

internet


internet           1.000000
acces              0.530547
demarches          0.406656
site               0.376652
administratives    0.310448
declaration        0.284289
tout               0.264019
faire              0.258209
grise              0.235931
faut               0.216061
Name: internet, dtype: float32

service


service     1.000000
public      0.507756
tout        0.157710
faire       0.152239
impots      0.133773
publics     0.133087
ligne       0.120462
securite    0.110756
poste       0.102147
internet    0.093619
Name: service, dtype: float32

poste


poste          1.000000
public         0.104447
service        0.089357
services       0.077768
impots         0.070538
publics        0.000000
declaration    0.000000
cpam           0.000000
ligne          0.000000
degradation    0.000000
Name: poste, dtype: float32

demarches


demarches          1.000000
administratives    0.737313
faire              0.217910
ligne              0.209571
internet           0.191441
services           0.053065
impots             0.043819
cpam               0.000000
pole               0.000000
evolue             0.000000
Name: demarches, dtype: float32

ligne


ligne          1.000000
declaration    0.347880
demarches      0.206169
impots         0.091557
service        0.083096
services       0.080207
cpam           0.000000
publics        0.000000
degradation    0.000000
pole           0.000000
Name: ligne, dtype: float32

publics


publics      1.000000
services     0.301616
evolution    0.170520
tous         0.152977
public       0.105481
service      0.081958
internet     0.060757
aucun        0.044974
impots       0.021910
source       0.000000
Name: publics, dtype: float32

tous


tous           1.000000
publics        0.137708
services       0.103690
internet       0.066106
aucun          0.055556
impots         0.021731
declaration    0.000000
cpam           0.000000
ligne          0.000000
pole           0.000000
Name: tous, dtype: float32

public


public      1.000000
tresor      0.932099
service     0.279454
publics     0.094270
services    0.071973
poste       0.065712
internet    0.039358
aucun       0.036706
impots      0.020128
source      0.000000
Name: public, dtype: float32

securite


securite           1.000000
sociale            0.939359
impots             0.073032
service            0.059192
services           0.044526
pole               0.000000
identite           0.000000
grise              0.000000
administratives    0.000000
emploi             0.000000
Name: securite, dtype: float32

sociale


sociale        1.000000
securite       0.874334
impots         0.071607
services       0.042391
publics        0.000000
declaration    0.000000
tout           0.000000
cpam           0.000000
degradation    0.000000
ligne          0.000000
Name: sociale, dtype: float32

tout


tout        1.000000
faire       0.159701
internet    0.086358
service     0.076836
services    0.054895
aucun       0.043981
impots      0.027610
cpam        0.000000
ligne       0.000000
pole        0.000000
Name: tout, dtype: float32

declaration


declaration        1.000000
impot              0.258252
ligne              0.230198
internet           0.087123
impots             0.083719
emploi             0.000000
agents             0.000000
identite           0.000000
grise              0.000000
administratives    0.000000
Name: declaration, dtype: float32

administration


administration     1.000000
fiscale            0.866267
services           0.032632
emploi             0.000000
degradation        0.000000
agents             0.000000
identite           0.000000
grise              0.000000
administratives    0.000000
pole               0.000000
Name: administration, dtype: float32

carte


carte        1.000000
grise        0.971861
passeport    0.482993
identite     0.477064
internet     0.057700
impots       0.044353
services     0.033852
ligne        0.000000
cpam         0.000000
evolue       0.000000
Name: carte, dtype: float32

evolution


evolution          1.000000
positive           0.452333
publics            0.109057
services           0.064654
internet           0.044326
emploi             0.000000
agents             0.000000
identite           0.000000
grise              0.000000
administratives    0.000000
Name: evolution, dtype: float32

faire


faire          1.000000
tout           0.125000
demarches      0.118506
internet       0.066106
service        0.058054
services       0.050320
impots         0.020841
ligne          0.000000
pole           0.000000
degradation    0.000000
Name: faire, dtype: float32

acces


acces          1.000000
internet       0.126099
services       0.057944
impots         0.022088
publics        0.000000
declaration    0.000000
cpam           0.000000
ligne          0.000000
pole           0.000000
aucun          0.000000
Name: acces, dtype: float32

In [64]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_10[i].sort_values(ascending=False).head(10))

impots


impots         0.000178
gouv           0.000121
site           0.000105
declaration    0.000104
source         0.000092
sociale        0.000082
securite       0.000078
caf            0.000077
service        0.000076
ligne          0.000076
Name: impots, dtype: float32

services


services     0.000305
fiscaux      0.000281
publics      0.000279
publiques    0.000120
maniere      0.000110
tous         0.000106
evolue       0.000106
agents       0.000102
exemple      0.000101
positive     0.000101
Name: services, dtype: float32

aucun


aucun        0.000331
tous         0.000057
tout         0.000051
publics      0.000042
public       0.000038
service      0.000032
services     0.000023
non               NaN
numerique         NaN
caf               NaN
Name: aucun, dtype: float32

internet


internet           0.000382
acces              0.000203
demarches          0.000155
site               0.000144
administratives    0.000119
declaration        0.000109
tout               0.000101
faire              0.000099
grise              0.000090
faut               0.000083
Name: internet, dtype: float32

service


service     0.000569
public      0.000289
tout        0.000090
faire       0.000087
impots      0.000076
publics     0.000076
ligne       0.000069
securite    0.000063
poste       0.000058
internet    0.000053
Name: service, dtype: float32

poste


poste        0.000651
public       0.000068
service      0.000058
services     0.000051
impots       0.000046
non               NaN
numerique         NaN
caf               NaN
source            NaN
evolution         NaN
Name: poste, dtype: float32

demarches


demarches          0.000812
administratives    0.000598
faire              0.000177
ligne              0.000170
internet           0.000155
services           0.000043
impots             0.000036
non                     NaN
numerique               NaN
caf                     NaN
Name: demarches, dtype: float32

ligne


ligne          0.000825
declaration    0.000287
demarches      0.000170
impots         0.000076
service        0.000069
services       0.000066
non                 NaN
numerique           NaN
caf                 NaN
source              NaN
Name: ligne, dtype: float32

publics


publics      0.000924
services     0.000279
evolution    0.000158
tous         0.000141
public       0.000097
service      0.000076
internet     0.000056
aucun        0.000042
impots       0.000020
non               NaN
Name: publics, dtype: float32

tous


tous         0.001027
publics      0.000141
services     0.000106
internet     0.000068
aucun        0.000057
impots       0.000022
non               NaN
numerique         NaN
caf               NaN
source            NaN
Name: tous, dtype: float32

public


public      0.001034
tresor      0.000964
service     0.000289
publics     0.000097
services    0.000074
poste       0.000068
internet    0.000041
aucun       0.000038
impots      0.000021
non              NaN
Name: public, dtype: float32

securite


securite     0.001065
sociale      0.001000
impots       0.000078
service      0.000063
services     0.000047
non               NaN
numerique         NaN
caf               NaN
source            NaN
evolution         NaN
Name: securite, dtype: float32

sociale


sociale      0.001144
securite     0.001000
impots       0.000082
services     0.000049
non               NaN
numerique         NaN
caf               NaN
source            NaN
evolution         NaN
carte             NaN
Name: sociale, dtype: float32

tout


tout         0.001168
faire        0.000187
internet     0.000101
service      0.000090
services     0.000064
aucun        0.000051
impots       0.000032
non               NaN
numerique         NaN
caf               NaN
Name: tout, dtype: float32

declaration


declaration    0.001247
impot          0.000322
ligne          0.000287
internet       0.000109
impots         0.000104
non                 NaN
numerique           NaN
caf                 NaN
source              NaN
evolution           NaN
Name: declaration, dtype: float32

administration


administration    0.001408
fiscale           0.001220
services          0.000046
non                    NaN
numerique              NaN
caf                    NaN
source                 NaN
evolution              NaN
securite               NaN
carte                  NaN
Name: administration, dtype: float32

carte


carte        0.001427
grise        0.001386
passeport    0.000689
identite     0.000681
internet     0.000082
impots       0.000063
services     0.000048
non               NaN
numerique         NaN
caf               NaN
Name: carte, dtype: float32

evolution


evolution    0.001445
positive     0.000654
publics      0.000158
services     0.000093
internet     0.000064
non               NaN
numerique         NaN
caf               NaN
source            NaN
securite          NaN
Name: evolution, dtype: float32

faire


faire        0.001493
tout         0.000187
demarches    0.000177
internet     0.000099
service      0.000087
services     0.000075
impots       0.000031
non               NaN
numerique         NaN
caf               NaN
Name: faire, dtype: float32

acces


acces        0.001608
internet     0.000203
services     0.000093
impots       0.000036
non               NaN
numerique         NaN
caf               NaN
source            NaN
evolution         NaN
securite          NaN
Name: acces, dtype: float32

In [65]:
gc.collect()

147

# Question 11 : Quels sont les services publics qui doivent le plus évoluer selon vous ?

In [66]:
question_11 = "Quels sont les services publics qui doivent le plus évoluer selon vous ?"
qu_11,df_qu_11_one_hot,df_cov_11,df_confidence_11,df_lift_11 = compute_similarities(question_11, new_res)

In [67]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_11[i].sort_values(ascending=False).head(10))

services


services     3410
publics       746
tous          642
sante         567
service       357
education     316
hopitaux      292
faut          283
public        269
faire         252
Name: services, dtype: uint16

tous


tous         3198
services      642
service       280
faut          262
publics       251
education     243
faire         218
sante         211
public        206
tout          197
Name: tous, dtype: uint16

education


education    3158
nationale    1729
sante        1027
justice       504
services      316
hopitaux      272
tous          243
police        237
emploi        224
faut          204
Name: education, dtype: uint16

sante


sante         2927
education     1027
services       567
justice        401
nationale      298
hopitaux       285
securite       273
transports     234
service        212
tous           211
Name: sante, dtype: uint16

nationale


nationale      1841
education      1729
sante           298
justice         279
services        201
police          176
emploi          163
hopitaux        147
tous            144
enseignants     141
Name: nationale, dtype: uint16

emploi


emploi       1831
pole         1537
caf           333
services      235
education     224
nationale     163
securite      152
sante         151
sociale       149
service       134
Name: emploi, dtype: uint16

justice


justice      1797
education     504
sante         401
police        353
nationale     279
services      219
moyens        166
hopitaux      146
securite      137
tous          128
Name: justice, dtype: uint16

service


service      1616
public        570
services      357
tous          280
sante         212
impots        191
faut          186
faire         181
education     166
tout          163
Name: service, dtype: uint16

pole


pole         1585
emploi       1537
caf           326
services      171
education     161
securite      133
sociale       128
nationale     127
service       104
impots        102
Name: pole, dtype: uint16

hopitaux


hopitaux     1491
services      292
sante         285
education     272
urgences      155
publics       149
nationale     147
justice       146
police        143
personnel     142
Name: hopitaux, dtype: uint16

impots


impots        1291
services       212
service        191
caf            133
emploi         109
securite       108
poste          104
pole           102
sociale        102
transports       0
Name: impots, dtype: uint16

securite


securite     1207
sociale       733
sante         273
services      204
education     197
emploi        152
caf           143
justice       137
pole          133
tous          110
Name: securite, dtype: uint16

hopital


hopital      1131
education     176
public        154
sante         145
services      134
urgences      128
justice       115
ecole         107
nationale     107
nombre          0
Name: hopital, dtype: uint16

poste


poste       1094
services     196
sncf         167
service      137
hopitaux     104
impots       104
soins          0
charge         0
hopital        0
publics        0
Name: poste, dtype: uint16

transports


transports    1093
sante          234
commun         223
publics        178
services       176
education      166
hopitaux       111
soins            0
voir             0
charge           0
Name: transports, dtype: uint16

public


public       1089
service       570
services      269
tous          206
faut          162
hopital       154
sante         152
education     148
faire         131
tout          128
Name: public, dtype: uint16

caf


caf         1088
emploi       333
pole         326
cpam         156
sociale      144
securite     143
services     135
impots       133
accueil        0
publics        0
Name: caf, dtype: uint16

faut


faut         1066
services      283
tous          262
faire         226
education     204
service       186
tout          186
sante         177
public        162
publics       148
Name: faut, dtype: uint16

tout


tout         1046
services      249
tous          197
faut          186
faire         183
education     182
service       163
sante         162
monde         129
public        128
Name: tout, dtype: uint16

police


police         1027
justice         353
education       237
gendarmerie     202
services        186
sante           185
nationale       176
hopitaux        143
voir              0
communes          0
Name: police, dtype: uint16

In [68]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_11[i].sort_values(ascending=False).head(10))

services


services          1.000000
publics           0.739346
sociaux           0.728302
administratifs    0.549618
proximite         0.433010
publiques         0.425856
evoluer           0.359914
exemple           0.335249
medecins          0.301408
acces             0.294355
Name: services, dtype: float32

tous


tous        1.000000
evoluer     0.308190
citoyens    0.306931
non         0.278912
publics     0.248761
exemple     0.247126
faut        0.245779
internet    0.244493
faire       0.223819
travail     0.205179
Name: tous, dtype: float32

education


education      1.000000
nationale      0.939164
enseignants    0.708185
eleves         0.707224
enfants        0.525547
formation      0.387255
sante          0.350871
mieux          0.330097
niveau         0.318043
travail        0.286853
Name: education, dtype: float32

sante


sante           1.000000
medecins        0.518310
maisons         0.431034
soins           0.390390
education       0.325206
urgences        0.296471
moyens          0.296403
transport       0.281796
publique        0.275943
enseignement    0.261044
Name: sante, dtype: float32

nationale


nationale      1.000000
education      0.547498
eleves         0.509506
enseignants    0.501779
formation      0.252451
travail        0.205179
police         0.171373
moyens         0.158273
justice        0.155259
faire          0.135524
Name: nationale, dtype: float32

emploi


emploi       1.000000
pole         0.969716
caf          0.306066
formation    0.291667
sociale      0.164823
securite     0.125932
nationale    0.088539
impots       0.084431
service      0.082921
education    0.070931
Name: emploi, dtype: float32

justice


justice      1.000000
police       0.343720
moyens       0.238849
education    0.159595
nationale    0.151548
sante        0.137000
securite     0.113505
hopital      0.101680
hopitaux     0.097921
service      0.072401
Name: justice, dtype: float32

service


service    1.000000
public     0.523416
non        0.241497
exemple    0.201149
faire      0.185832
faut       0.174484
tout       0.155832
publics    0.155600
moyens     0.152518
impots     0.147947
Name: service, dtype: float32

pole


pole         1.000000
emploi       0.839432
caf          0.299632
sociale      0.141593
securite     0.110191
impots       0.079009
nationale    0.068984
service      0.064356
education    0.050982
services     0.050147
Name: pole, dtype: float32

hopitaux


hopitaux     1.000000
ecoles       0.386861
urgences     0.364706
medecins     0.318310
personnel    0.274131
moyens       0.197122
publics      0.147671
police       0.139241
faire        0.118070
faut         0.103189
Name: hopitaux, dtype: float32

impots


impots      1.000000
caf         0.122243
service     0.118193
sociale     0.112832
poste       0.095064
securite    0.089478
pole        0.064353
services    0.062170
emploi      0.059530
hopitaux    0.000000
Name: impots, dtype: float32

securite


securite     1.000000
sociale      0.810841
caf          0.131434
sante        0.093270
pole         0.083912
impots       0.083656
emploi       0.083015
justice      0.076238
education    0.062381
services     0.059824
Name: securite, dtype: float32

hopital


hopital      1.000000
urgences     0.301176
ecole        0.168770
public       0.141414
justice      0.063996
nationale    0.058121
education    0.055731
sante        0.049539
services     0.039296
nombre       0.000000
Name: hopital, dtype: float32

poste


poste       1.000000
sncf        0.317490
service     0.084777
impots      0.080558
hopitaux    0.069752
services    0.057478
soins       0.000000
charge      0.000000
hopital     0.000000
publics     0.000000
Name: poste, dtype: float32

transports


transports    1.000000
commun        0.728758
publics       0.176412
sante         0.079945
hopitaux      0.074447
education     0.052565
services      0.051613
soins         0.000000
voir          0.000000
charge        0.000000
Name: transports, dtype: float32

public


public       1.000000
service      0.352723
faut         0.151970
hopital      0.136163
faire        0.134497
tout         0.122371
publics      0.118930
services     0.078886
tous         0.064415
nationale    0.058664
Name: public, dtype: float32

caf


caf         1.000000
cpam        0.471299
pole        0.205678
emploi      0.181868
sociale     0.159292
securite    0.118476
impots      0.103021
services    0.039589
accueil     0.000000
publics     0.000000
Name: caf, dtype: float32

faut


faut        1.000000
exemple     0.239464
faire       0.232033
moyens      0.200000
non         0.190476
tout        0.177820
public      0.148760
publics     0.146680
service     0.115099
services    0.082991
Name: faut, dtype: float32

tout


tout         1.000000
monde        0.486792
temps        0.243736
non          0.207483
faire        0.187885
faut         0.174484
public       0.117539
service      0.100866
services     0.073021
nationale    0.061923
Name: tout, dtype: float32

police


police         1.000000
gendarmerie    0.798419
justice        0.196439
hopitaux       0.095909
nationale      0.095600
education      0.075048
sante          0.063205
services       0.054545
cartes         0.000000
charge         0.000000
Name: police, dtype: float32

In [69]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_11[i].sort_values(ascending=False).head(10))

services


services          0.000293
publics           0.000217
sociaux           0.000214
administratifs    0.000161
proximite         0.000127
publiques         0.000125
evoluer           0.000106
exemple           0.000098
medecins          0.000088
acces             0.000086
Name: services, dtype: float32

tous


tous        0.000313
evoluer     0.000096
citoyens    0.000096
non         0.000087
publics     0.000078
exemple     0.000077
faut        0.000077
internet    0.000076
faire       0.000070
travail     0.000064
Name: tous, dtype: float32

education


education      0.000317
nationale      0.000297
enseignants    0.000224
eleves         0.000224
enfants        0.000166
formation      0.000123
sante          0.000111
mieux          0.000105
niveau         0.000101
travail        0.000091
Name: education, dtype: float32

sante


sante           0.000342
medecins        0.000177
maisons         0.000147
soins           0.000133
education       0.000111
urgences        0.000101
moyens          0.000101
transport       0.000096
publique        0.000094
enseignement    0.000089
Name: sante, dtype: float32

nationale


nationale      0.000543
education      0.000297
eleves         0.000277
enseignants    0.000273
formation      0.000137
travail        0.000111
police         0.000093
moyens         0.000086
justice        0.000084
faire          0.000074
Name: nationale, dtype: float32

emploi


emploi       0.000546
pole         0.000530
caf          0.000167
formation    0.000159
sociale      0.000090
securite     0.000069
nationale    0.000048
impots       0.000046
service      0.000045
education    0.000039
Name: emploi, dtype: float32

justice


justice      0.000556
police       0.000191
moyens       0.000133
education    0.000089
nationale    0.000084
sante        0.000076
securite     0.000063
hopital      0.000057
hopitaux     0.000054
service      0.000040
Name: justice, dtype: float32

service


service    0.000619
public     0.000324
non        0.000149
exemple    0.000124
faire      0.000115
faut       0.000108
tout       0.000096
publics    0.000096
moyens     0.000094
impots     0.000092
Name: service, dtype: float32

pole


pole         0.000631
emploi       0.000530
caf          0.000189
sociale      0.000089
securite     0.000070
impots       0.000050
nationale    0.000044
service      0.000041
education    0.000032
services     0.000032
Name: pole, dtype: float32

hopitaux


hopitaux     0.000671
ecoles       0.000259
urgences     0.000245
medecins     0.000213
personnel    0.000184
moyens       0.000132
publics      0.000099
police       0.000093
faire        0.000079
faut         0.000069
Name: hopitaux, dtype: float32

impots


impots      0.000775
caf         0.000095
service     0.000092
sociale     0.000087
poste       0.000074
securite    0.000069
pole        0.000050
services    0.000048
emploi      0.000046
non              NaN
Name: impots, dtype: float32

securite


securite     0.000829
sociale      0.000672
caf          0.000109
sante        0.000077
pole         0.000070
impots       0.000069
emploi       0.000069
justice      0.000063
education    0.000052
services     0.000050
Name: securite, dtype: float32

hopital


hopital      0.000884
urgences     0.000266
ecole        0.000149
public       0.000125
justice      0.000057
nationale    0.000051
education    0.000049
sante        0.000044
services     0.000035
non               NaN
Name: hopital, dtype: float32

poste


poste          0.000914
sncf           0.000290
service        0.000077
impots         0.000074
hopitaux       0.000064
services       0.000053
non                 NaN
caf                 NaN
gendarmerie         NaN
securite            NaN
Name: poste, dtype: float32

transports


transports     0.000915
commun         0.000667
publics        0.000161
sante          0.000073
hopitaux       0.000068
education      0.000048
services       0.000047
non                 NaN
caf                 NaN
gendarmerie         NaN
Name: transports, dtype: float32

public


public       0.000918
service      0.000324
faut         0.000140
hopital      0.000125
faire        0.000124
tout         0.000112
publics      0.000109
services     0.000072
tous         0.000059
nationale    0.000054
Name: public, dtype: float32

caf


caf            0.000919
cpam           0.000433
pole           0.000189
emploi         0.000167
sociale        0.000146
securite       0.000109
impots         0.000095
services       0.000036
non                 NaN
gendarmerie         NaN
Name: caf, dtype: float32

faut


faut        0.000938
exemple     0.000225
faire       0.000218
moyens      0.000188
non         0.000179
tout        0.000167
public      0.000140
publics     0.000138
service     0.000108
services    0.000078
Name: faut, dtype: float32

tout


tout         0.000956
monde        0.000465
temps        0.000233
non          0.000198
faire        0.000180
faut         0.000167
public       0.000112
service      0.000096
services     0.000070
nationale    0.000059
Name: tout, dtype: float32

police


police         0.000974
gendarmerie    0.000777
justice        0.000191
hopitaux       0.000093
nationale      0.000093
education      0.000073
sante          0.000062
services       0.000053
non                 NaN
caf                 NaN
Name: police, dtype: float32

In [70]:
gc.collect()

147

# Question 12 :  Connaissez-vous le "droit à l'erreur", c'est-à-dire le droit d'affirmer votre bonne foi lorsque vous faites un erreur dans vos déclarations ?

In [71]:
question_12 = 'Connaissez-vous le "droit à l\'erreur", c\'est-à-dire le droit d\'affirmer votre bonne foi lorsque vous faites un erreur dans vos déclarations ?'
qu_12,df_qu_12_one_hot,df_cov_12,df_confidence_12,df_lift_12 = compute_similarities(question_12, new_res)

In [72]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_12[i].sort_values(ascending=False).head(10))

oui


oui    23995
non        0
Name: oui, dtype: uint16

non


non    6164
oui       0
Name: non, dtype: uint16

In [73]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_12[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [74]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_12[i].sort_values(ascending=False).head(10))

oui


oui    0.000042
non         NaN
Name: oui, dtype: float32

non


non    0.000162
oui         NaN
Name: non, dtype: float32

In [75]:
gc.collect()

14

# Question 13 :  Si oui, avez-vous déjà utilisé ce droit à l'erreur ?

In [76]:
question_13 = "Si oui, avez-vous déjà utilisé ce droit à l'erreur ?"
qu_13,df_qu_13_one_hot,df_cov_13,df_confidence_13,df_lift_13 = compute_similarities(question_13, new_res)

In [77]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_13[i].sort_values(ascending=False).head(10))

non


non    24279
oui        0
Name: non, dtype: uint16

oui


oui    2217
non       0
Name: oui, dtype: uint16

In [78]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_13[i].sort_values(ascending=False).head(10))

non


non    1.0
oui    0.0
Name: non, dtype: float32

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

In [79]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_13[i].sort_values(ascending=False).head(10))

non


non    0.000041
oui         NaN
Name: non, dtype: float32

oui


oui    0.000451
non         NaN
Name: oui, dtype: float32

In [80]:
gc.collect()

14

# Question 14 :  Si oui, à quelle occasion en avez-vous fait usage ?

In [81]:
question_14 = "Si oui, à quelle occasion en avez-vous fait usage ?"
qu_14,df_qu_14_one_hot,df_cov_14,df_confidence_14,df_lift_14 = compute_similarities(question_14, new_res)

In [82]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_14[i].sort_values(ascending=False).head(10))

declaration


declaration    933
impots         308
erreur         290
impot          196
droit            0
Name: declaration, dtype: uint16

impots


impots         731
declaration    308
erreur         190
impot            0
droit            0
Name: impots, dtype: uint16

erreur


erreur         704
droit          293
declaration    290
impots         190
impot            0
Name: erreur, dtype: uint16

droit


droit          385
erreur         293
declaration      0
impot            0
impots           0
Name: droit, dtype: uint16

impot


impot          358
declaration    196
erreur           0
impots           0
droit            0
Name: impot, dtype: uint16

In [83]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_14[i].sort_values(ascending=False).head(10))

declaration


declaration    1.000000
impot          0.547486
impots         0.421341
erreur         0.411932
droit          0.000000
Name: declaration, dtype: float32

impots


impots         1.000000
declaration    0.330118
erreur         0.269886
impot          0.000000
droit          0.000000
Name: impots, dtype: float32

erreur


erreur         1.000000
droit          0.761039
declaration    0.310825
impots         0.259918
impot          0.000000
Name: erreur, dtype: float32

droit


droit          1.000000
erreur         0.416193
declaration    0.000000
impot          0.000000
impots         0.000000
Name: droit, dtype: float32

impot


impot          1.000000
declaration    0.210075
erreur         0.000000
impots         0.000000
droit          0.000000
Name: impot, dtype: float32

In [84]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_14[i].sort_values(ascending=False).head(10))

declaration


declaration    0.001072
impot          0.000587
impots         0.000452
erreur         0.000442
droit               NaN
Name: declaration, dtype: float32

impots


impots         0.001368
declaration    0.000452
erreur         0.000369
droit               NaN
impot               NaN
Name: impots, dtype: float32

erreur


erreur         0.001420
droit          0.001081
declaration    0.000442
impots         0.000369
impot               NaN
Name: erreur, dtype: float32

droit


droit          0.002597
erreur         0.001081
impots              NaN
impot               NaN
declaration         NaN
Name: droit, dtype: float32

impot


impot          0.002793
declaration    0.000587
droit               NaN
impots              NaN
erreur              NaN
Name: impot, dtype: float32

In [85]:
gc.collect()

196

# Question 15 :  Pouvez-vous identifier des règles que l'administration vous a déjà demandé d'appliquer et que vous avez jugées inutiles ou trop complexes ?

In [86]:
question_15 = "Pouvez-vous identifier des règles que l'administration vous a déjà demandé d'appliquer et que vous avez jugées inutiles ou trop complexes ?"
qu_15,df_qu_15_one_hot,df_cov_15,df_confidence_15,df_lift_15 = compute_similarities(question_15, new_res)

In [87]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_15[i].sort_values(ascending=False).head(10))

non


non             1734
faire            130
demande          112
caf                0
regles             0
droit              0
informations       0
tout               0
travail            0
entreprise         0
Name: non, dtype: uint16

demande


demande           1519
faire              241
dossier            205
administration     202
carte              197
documents          191
permis             178
tout               157
mois               152
travaux            140
Name: demande, dtype: uint16

faire


faire             1166
demande            241
faut               209
tout               200
carte              159
administration     159
exemple            140
declaration        134
mois               132
non                130
Name: faire, dtype: uint16

impots


impots         1095
declaration     273
faire           128
payer           108
identite          0
grise             0
emploi            0
pole              0
inutile           0
complexe          0
Name: impots, dtype: uint16

declaration


declaration    1067
impots          273
travaux         187
revenus         186
impot           152
faire           134
demande         110
complexe        104
inutile           0
grise             0
Name: declaration, dtype: uint16

regles


regles            1019
urbanisme          160
complexes          154
administration     108
exemple            105
papier               0
pole                 0
cas                  0
identite             0
grise                0
Name: regles, dtype: uint16

permis


permis        994
construire    636
demande       178
travaux       128
inutile         0
identite        0
grise           0
emploi          0
pole            0
complexe        0
Name: permis, dtype: uint16

administration


administration    939
demande           202
faire             159
tout              111
documents         110
regles            108
exemple           106
papier              0
emploi              0
identite            0
Name: administration, dtype: uint16

tout


tout              939
faire             200
demande           157
faut              136
temps             122
administration    111
exemple           106
travail             0
grise               0
80                  0
Name: tout, dtype: uint16

carte


carte             921
grise             445
identite          352
demande           197
faire             159
renouvellement    125
passeport         124
internet          111
pole                0
cas                 0
Name: carte, dtype: uint16

dossier


dossier     796
demande     205
faire       127
retraite    118
papier        0
inutile       0
identite      0
grise         0
emploi        0
pole          0
Name: dossier, dtype: uint16

documents


documents         776
demande           191
fournir           154
demandes          114
administration    110
papier              0
regles              0
identite            0
grise               0
emploi              0
Name: documents, dtype: uint16

exemple


exemple           761
faire             140
demande           138
tout              106
administration    106
regles            105
papier              0
emploi              0
identite            0
grise               0
Name: exemple, dtype: uint16

faut


faut        683
faire       209
tout        136
demande     131
papier        0
inutile       0
regles        0
identite      0
grise         0
emploi        0
Name: faut, dtype: uint16

construire


construire    675
permis        636
demande       114
travaux       107
inutile         0
identite        0
grise           0
emploi          0
pole            0
complexe        0
Name: construire, dtype: uint16

tous


tous        627
ans         163
faire       115
demande     101
papier        0
pole          0
regles        0
identite      0
grise         0
emploi        0
Name: tous, dtype: uint16

internet


internet    574
faire       129
demande     123
carte       111
papier        0
complexe      0
identite      0
grise         0
emploi        0
pole          0
Name: internet, dtype: uint16

complexe


complexe       559
declaration    104
regles           0
identite         0
grise            0
emploi           0
pole             0
inutile          0
papier           0
80               0
Name: complexe, dtype: uint16

identite


identite          552
carte             352
renouvellement    137
passeport         127
demande           119
papier              0
inutile             0
regles              0
grise               0
emploi              0
Name: identite, dtype: uint16

travaux


travaux        540
declaration    187
demande        140
permis         128
construire     107
inutile          0
identite         0
grise            0
emploi           0
pole             0
Name: travaux, dtype: uint16

In [88]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_15[i].sort_values(ascending=False).head(10))

non


non             1.000000
faire           0.111492
demande         0.073733
caf             0.000000
regles          0.000000
droit           0.000000
informations    0.000000
tout            0.000000
travail         0.000000
entreprise      0.000000
Name: non, dtype: float32

demande


demande      1.000000
retraite     0.288591
mois         0.288425
travaux      0.259259
dossier      0.257538
2            0.254364
ans          0.251880
documents    0.246134
fournir      0.228814
identite     0.215580
Name: demande, dtype: float32

faire


faire       1.000000
faut        0.306003
mois        0.250474
temps       0.238372
ans         0.225564
internet    0.224739
tout        0.212993
exemple     0.183968
tous        0.183413
carte       0.172638
Name: faire, dtype: float32

impots


impots         1.000000
payer          0.299169
declaration    0.255858
faire          0.109777
identite       0.000000
grise          0.000000
emploi         0.000000
pole           0.000000
inutile        0.000000
complexe       0.000000
Name: impots, dtype: float32

declaration


declaration    1.000000
revenus        0.442857
travaux        0.346296
impot          0.320000
impots         0.249315
complexe       0.186047
faire          0.114923
demande        0.072416
inutile        0.000000
grise          0.000000
Name: declaration, dtype: float32

regles


regles            1.000000
urbanisme         0.423280
complexes         0.357309
exemple           0.137976
administration    0.115016
papier            0.000000
pole              0.000000
cas               0.000000
identite          0.000000
grise             0.000000
Name: regles, dtype: float32

permis


permis        1.000000
construire    0.942222
travaux       0.237037
demande       0.117182
inutile       0.000000
identite      0.000000
grise         0.000000
emploi        0.000000
pole          0.000000
complexe      0.000000
Name: permis, dtype: float32

administration


administration    1.000000
documents         0.141753
exemple           0.139290
faire             0.136364
demande           0.132982
tout              0.118211
regles            0.105986
papier            0.000000
emploi            0.000000
identite          0.000000
Name: administration, dtype: float32

tout


tout              1.000000
temps             0.236434
faut              0.199122
faire             0.171527
exemple           0.139290
administration    0.118211
demande           0.103357
entreprise        0.000000
refaire           0.000000
declaration       0.000000
Name: tout, dtype: float32

carte


carte             1.000000
grise             0.986696
identite          0.637681
passeport         0.417508
renouvellement    0.383436
internet          0.193380
faire             0.136364
demande           0.129691
pole              0.000000
cas               0.000000
Name: carte, dtype: float32

dossier


dossier     1.000000
retraite    0.263982
demande     0.134957
faire       0.108919
papier      0.000000
inutile     0.000000
identite    0.000000
grise       0.000000
emploi      0.000000
pole        0.000000
Name: dossier, dtype: float32

documents


documents         1.000000
fournir           0.326271
demandes          0.217557
demande           0.125741
administration    0.117146
papier            0.000000
regles            0.000000
identite          0.000000
grise             0.000000
emploi            0.000000
Name: documents, dtype: float32

exemple


exemple           1.000000
faire             0.120069
tout              0.112886
administration    0.112886
regles            0.103042
demande           0.090849
papier            0.000000
emploi            0.000000
identite          0.000000
grise             0.000000
Name: exemple, dtype: float32

faut


faut        1.000000
faire       0.179245
tout        0.144835
demande     0.086241
papier      0.000000
inutile     0.000000
regles      0.000000
identite    0.000000
grise       0.000000
emploi      0.000000
Name: faut, dtype: float32

construire


construire    1.000000
permis        0.639839
travaux       0.198148
demande       0.075049
inutile       0.000000
identite      0.000000
grise         0.000000
emploi        0.000000
pole          0.000000
complexe      0.000000
Name: construire, dtype: float32

tous


tous        1.000000
ans         0.306391
faire       0.098628
demande     0.066491
papier      0.000000
pole        0.000000
regles      0.000000
identite    0.000000
grise       0.000000
emploi      0.000000
Name: tous, dtype: float32

internet


internet    1.000000
carte       0.120521
faire       0.110635
demande     0.080974
papier      0.000000
complexe    0.000000
identite    0.000000
grise       0.000000
emploi      0.000000
pole        0.000000
Name: internet, dtype: float32

complexe


complexe       1.00000
declaration    0.09747
regles         0.00000
identite       0.00000
grise          0.00000
emploi         0.00000
pole           0.00000
inutile        0.00000
papier         0.00000
80             0.00000
Name: complexe, dtype: float32

identite


identite          1.000000
passeport         0.427609
renouvellement    0.420245
carte             0.382193
demande           0.078341
papier            0.000000
inutile           0.000000
regles            0.000000
grise             0.000000
emploi            0.000000
Name: identite, dtype: float32

travaux


travaux        1.000000
declaration    0.175258
construire     0.158519
permis         0.128773
demande        0.092166
inutile        0.000000
identite       0.000000
grise          0.000000
emploi         0.000000
pole           0.000000
Name: travaux, dtype: float32

In [89]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_15[i].sort_values(ascending=False).head(10))

non


non         0.000577
faire       0.000064
demande     0.000043
fournir          NaN
caf              NaN
securite         NaN
obtenir          NaN
compte           NaN
carte            NaN
payer            NaN
Name: non, dtype: float32

demande


demande      0.000658
retraite     0.000190
mois         0.000190
travaux      0.000171
dossier      0.000170
2            0.000167
ans          0.000166
documents    0.000162
fournir      0.000151
identite     0.000142
Name: demande, dtype: float32

faire


faire       0.000858
faut        0.000262
mois        0.000215
temps       0.000204
ans         0.000193
internet    0.000193
tout        0.000183
exemple     0.000158
tous        0.000157
carte       0.000148
Name: faire, dtype: float32

impots


impots         0.000913
payer          0.000273
declaration    0.000234
faire          0.000100
non                 NaN
fournir             NaN
caf                 NaN
securite            NaN
obtenir             NaN
compte              NaN
Name: impots, dtype: float32

declaration


declaration    0.000937
revenus        0.000415
travaux        0.000325
impot          0.000300
impots         0.000234
complexe       0.000174
faire          0.000108
demande        0.000068
non                 NaN
fournir             NaN
Name: declaration, dtype: float32

regles


regles            0.000981
urbanisme         0.000415
complexes         0.000351
exemple           0.000135
administration    0.000113
non                    NaN
fournir                NaN
caf                    NaN
securite               NaN
obtenir                NaN
Name: regles, dtype: float32

permis


permis        0.001006
construire    0.000948
travaux       0.000238
demande       0.000118
non                NaN
fournir            NaN
caf                NaN
securite           NaN
obtenir            NaN
compte             NaN
Name: permis, dtype: float32

administration


administration    0.001065
documents         0.000151
exemple           0.000148
faire             0.000145
demande           0.000142
tout              0.000126
regles            0.000113
non                    NaN
fournir                NaN
caf                    NaN
Name: administration, dtype: float32

tout


tout              0.001065
temps             0.000252
faut              0.000212
faire             0.000183
exemple           0.000148
administration    0.000126
demande           0.000110
non                    NaN
fournir                NaN
caf                    NaN
Name: tout, dtype: float32

carte


carte             0.001086
grise             0.001071
identite          0.000692
passeport         0.000453
renouvellement    0.000416
internet          0.000210
faire             0.000148
demande           0.000141
non                    NaN
fournir                NaN
Name: carte, dtype: float32

dossier


dossier     0.001256
retraite    0.000332
demande     0.000170
faire       0.000137
non              NaN
fournir          NaN
caf              NaN
securite         NaN
obtenir          NaN
compte           NaN
Name: dossier, dtype: float32

documents


documents         0.001289
fournir           0.000420
demandes          0.000280
demande           0.000162
administration    0.000151
non                    NaN
caf                    NaN
securite               NaN
obtenir                NaN
compte                 NaN
Name: documents, dtype: float32

exemple


exemple           0.001314
faire             0.000158
administration    0.000148
tout              0.000148
regles            0.000135
demande           0.000119
non                    NaN
fournir                NaN
caf                    NaN
securite               NaN
Name: exemple, dtype: float32

faut


faut        0.001464
faire       0.000262
tout        0.000212
demande     0.000126
non              NaN
fournir          NaN
caf              NaN
securite         NaN
obtenir          NaN
compte           NaN
Name: faut, dtype: float32

construire


construire    0.001481
permis        0.000948
travaux       0.000294
demande       0.000111
non                NaN
fournir            NaN
caf                NaN
securite           NaN
obtenir            NaN
compte             NaN
Name: construire, dtype: float32

tous


tous        0.001595
ans         0.000489
faire       0.000157
demande     0.000106
non              NaN
fournir          NaN
caf              NaN
securite         NaN
obtenir          NaN
compte           NaN
Name: tous, dtype: float32

internet


internet    0.001742
carte       0.000210
faire       0.000193
demande     0.000141
non              NaN
fournir          NaN
caf              NaN
securite         NaN
obtenir          NaN
compte           NaN
Name: internet, dtype: float32

complexe


complexe       0.001789
declaration    0.000174
non                 NaN
fournir             NaN
caf                 NaN
securite            NaN
obtenir             NaN
compte              NaN
carte               NaN
payer               NaN
Name: complexe, dtype: float32

identite


identite          0.001812
passeport         0.000775
renouvellement    0.000761
carte             0.000692
demande           0.000142
non                    NaN
fournir                NaN
caf                    NaN
securite               NaN
obtenir                NaN
Name: identite, dtype: float32

travaux


travaux        0.001852
declaration    0.000325
construire     0.000294
permis         0.000238
demande        0.000171
non                 NaN
fournir             NaN
caf                 NaN
securite            NaN
obtenir             NaN
Name: travaux, dtype: float32

In [90]:
gc.collect()

294

# Question 16 :  Faut-il donner plus d'autonomie aux fonctionnaires de terrain ?

In [91]:
question_16 = "Faut-il donner plus d'autonomie aux fonctionnaires de terrain ?"
qu_16,df_qu_16_one_hot,df_cov_16,df_confidence_16,df_lift_16 = compute_similarities(question_16, new_res)

In [92]:
for i in df_qu_16_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_16[i].sort_values(ascending=False).head(10))

oui


oui    18190
non        0
Name: oui, dtype: uint16

non


non    7489
oui       0
Name: non, dtype: uint16

In [93]:
for i in df_qu_16_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_16[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [94]:
for i in df_qu_16_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_16[i].sort_values(ascending=False).head(10))

oui


oui    0.000055
non         NaN
Name: oui, dtype: float32

non


non    0.000134
oui         NaN
Name: non, dtype: float32

In [95]:
gc.collect()

14

# Question 17 :   Si oui, comment ?

In [96]:
question_17 = "Si oui, comment ?_terrain"
qu_17,df_qu_17_one_hot,df_cov_17,df_confidence_17,df_lift_17 = compute_similarities(question_17, new_res)

In [97]:
for i in df_qu_17_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_17[i].sort_values(ascending=False).head(10))

fonctionnaires


fonctionnaires    1375
terrain            438
faut               205
faire              184
autonomie          170
non                126
donner             116
pouvoir            114
travail            112
tout               108
Name: fonctionnaires, dtype: uint16

terrain


terrain           1152
fonctionnaires     438
fonctionnaire      207
faut               145
autonomie          138
faire              128
pouvoir            101
public               0
cadre                0
regles               0
Name: terrain, dtype: uint16

pouvoir


pouvoir           1072
decision           246
donner             129
fonctionnaires     114
faire              112
cas                101
terrain            101
public               0
oui                  0
decisions            0
Name: pouvoir, dtype: uint16

faire


faire             1052
confiance          259
fonctionnaires     184
faut               146
terrain            128
travail            121
pouvoir            112
tout               102
regles               0
prendre              0
Name: faire, dtype: uint16

autonomie


autonomie         1030
fonctionnaires     170
donner             141
terrain            138
faut               124
fonctionnaire      106
public               0
cadre                0
regles               0
prendre              0
Name: autonomie, dtype: uint16

faut


faut              911
fonctionnaires    205
faire             146
terrain           145
donner            135
autonomie         124
public              0
cadre               0
regles              0
prendre             0
Name: faut, dtype: uint16

donner


donner            734
autonomie         141
faut              135
pouvoir           129
fonctionnaires    116
moyens            105
public              0
question            0
regles              0
prendre             0
Name: donner, dtype: uint16

fonctionnaire


fonctionnaire    710
terrain          207
autonomie        106
public             0
cadre              0
decisions          0
regles             0
prendre            0
agents             0
cas                0
Name: fonctionnaire, dtype: uint16

decision


decision     656
pouvoir      246
public         0
cadre          0
controle       0
decisions      0
regles         0
prendre        0
agents         0
cas            0
Name: decision, dtype: uint16

formation


formation         625
public              0
tout                0
controle            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
responsabilite      0
Name: formation, dtype: uint16

confiance


confiance         616
faire             259
public              0
question            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
responsabilite      0
Name: confiance, dtype: uint16

non


non               607
fonctionnaires    126
oui               101
question            0
controle            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
Name: non, dtype: uint16

tout


tout              596
fonctionnaires    108
faire             102
question            0
controle            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
Name: tout, dtype: uint16

cas


cas               567
pouvoir           101
public              0
question            0
controle            0
decisions           0
regles              0
prendre             0
agents              0
responsabilite      0
Name: cas, dtype: uint16

travail


travail           544
faire             121
fonctionnaires    112
public              0
question            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
Name: travail, dtype: uint16

decisions


decisions         521
prendre           188
public              0
question            0
controle            0
regles              0
agents              0
cas                 0
responsabilite      0
competences         0
Name: decisions, dtype: uint16

donnant


donnant      504
moyens       102
public         0
question       0
controle       0
decisions      0
regles         0
prendre        0
agents         0
cas            0
Name: donnant, dtype: uint16

responsabilisant


responsabilisant    503
question              0
controle              0
decisions             0
regles                0
prendre               0
agents                0
cas                   0
responsabilite        0
competences           0
Name: responsabilisant, dtype: uint16

controle


controle          501
public              0
question            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
responsabilite      0
competences         0
Name: controle, dtype: uint16

services


services          493
public              0
tout                0
controle            0
decisions           0
regles              0
prendre             0
agents              0
cas                 0
responsabilite      0
Name: services, dtype: uint16

In [98]:
for i in df_qu_17_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_17[i].sort_values(ascending=False).head(10))

fonctionnaires


fonctionnaires    1.000000
terrain           0.380208
faut              0.225027
non               0.207578
travail           0.205882
tout              0.181208
faire             0.174905
autonomie         0.165049
donner            0.158038
pouvoir           0.106343
Name: fonctionnaires, dtype: float32

terrain


terrain           1.000000
fonctionnaires    0.318545
fonctionnaire     0.291549
faut              0.159166
autonomie         0.133981
faire             0.121673
pouvoir           0.094216
public            0.000000
cadre             0.000000
regles            0.000000
Name: terrain, dtype: float32

pouvoir


pouvoir           1.000000
decision          0.375000
cas               0.178131
donner            0.175749
faire             0.106464
terrain           0.087674
fonctionnaires    0.082909
public            0.000000
oui               0.000000
decisions         0.000000
Name: pouvoir, dtype: float32

faire


faire             1.000000
confiance         0.420455
travail           0.222426
tout              0.171141
faut              0.160263
fonctionnaires    0.133818
terrain           0.111111
pouvoir           0.104478
regles            0.000000
prendre           0.000000
Name: faire, dtype: float32

autonomie


autonomie         1.000000
donner            0.192098
fonctionnaire     0.149296
faut              0.136114
fonctionnaires    0.123636
terrain           0.119792
public            0.000000
cadre             0.000000
regles            0.000000
prendre           0.000000
Name: autonomie, dtype: float32

faut


faut              1.000000
donner            0.183924
fonctionnaires    0.149091
faire             0.138783
terrain           0.125868
autonomie         0.120388
public            0.000000
cadre             0.000000
regles            0.000000
prendre           0.000000
Name: faut, dtype: float32

donner


donner            1.000000
moyens            0.221987
faut              0.148189
autonomie         0.136893
pouvoir           0.120336
fonctionnaires    0.084364
public            0.000000
question          0.000000
regles            0.000000
prendre           0.000000
Name: donner, dtype: float32

fonctionnaire


fonctionnaire    1.000000
terrain          0.179688
autonomie        0.102913
public           0.000000
cadre            0.000000
decisions        0.000000
regles           0.000000
prendre          0.000000
agents           0.000000
cas              0.000000
Name: fonctionnaire, dtype: float32

decision


decision     1.000000
pouvoir      0.229478
public       0.000000
cadre        0.000000
controle     0.000000
decisions    0.000000
regles       0.000000
prendre      0.000000
agents       0.000000
cas          0.000000
Name: decision, dtype: float32

formation


formation         1.0
public            0.0
tout              0.0
controle          0.0
decisions         0.0
regles            0.0
prendre           0.0
agents            0.0
cas               0.0
responsabilite    0.0
Name: formation, dtype: float32

confiance


confiance         1.000000
faire             0.246198
public            0.000000
question          0.000000
decisions         0.000000
regles            0.000000
prendre           0.000000
agents            0.000000
cas               0.000000
responsabilite    0.000000
Name: confiance, dtype: float32

non


non               1.000000
oui               0.220524
fonctionnaires    0.091636
question          0.000000
controle          0.000000
decisions         0.000000
regles            0.000000
prendre           0.000000
agents            0.000000
cas               0.000000
Name: non, dtype: float32

tout


tout              1.000000
faire             0.096958
fonctionnaires    0.078545
question          0.000000
controle          0.000000
decisions         0.000000
regles            0.000000
prendre           0.000000
agents            0.000000
cas               0.000000
Name: tout, dtype: float32

cas


cas               1.000000
pouvoir           0.094216
public            0.000000
question          0.000000
controle          0.000000
decisions         0.000000
regles            0.000000
prendre           0.000000
agents            0.000000
responsabilite    0.000000
Name: cas, dtype: float32

travail


travail           1.000000
faire             0.115019
fonctionnaires    0.081455
public            0.000000
question          0.000000
decisions         0.000000
regles            0.000000
prendre           0.000000
agents            0.000000
cas               0.000000
Name: travail, dtype: float32

decisions


decisions         1.000000
prendre           0.408696
public            0.000000
question          0.000000
controle          0.000000
regles            0.000000
agents            0.000000
cas               0.000000
responsabilite    0.000000
competences       0.000000
Name: decisions, dtype: float32

donnant


donnant      1.000000
moyens       0.215645
public       0.000000
question     0.000000
controle     0.000000
decisions    0.000000
regles       0.000000
prendre      0.000000
agents       0.000000
cas          0.000000
Name: donnant, dtype: float32

responsabilisant


responsabilisant    1.0
question            0.0
controle            0.0
decisions           0.0
regles              0.0
prendre             0.0
agents              0.0
cas                 0.0
responsabilite      0.0
competences         0.0
Name: responsabilisant, dtype: float32

controle


controle          1.0
public            0.0
question          0.0
decisions         0.0
regles            0.0
prendre           0.0
agents            0.0
cas               0.0
responsabilite    0.0
competences       0.0
Name: controle, dtype: float32

services


services          1.0
public            0.0
tout              0.0
controle          0.0
decisions         0.0
regles            0.0
prendre           0.0
agents            0.0
cas               0.0
responsabilite    0.0
Name: services, dtype: float32

In [99]:
for i in df_qu_17_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_17[i].sort_values(ascending=False).head(10))

fonctionnaires


fonctionnaires    0.000727
terrain           0.000277
faut              0.000164
non               0.000151
travail           0.000150
tout              0.000132
faire             0.000127
autonomie         0.000120
donner            0.000115
pouvoir           0.000077
Name: fonctionnaires, dtype: float32

terrain


terrain           0.000868
fonctionnaires    0.000277
fonctionnaire     0.000253
faut              0.000138
autonomie         0.000116
faire             0.000106
pouvoir           0.000082
non                    NaN
decision               NaN
objectifs              NaN
Name: terrain, dtype: float32

pouvoir


pouvoir           0.000933
decision          0.000350
cas               0.000166
donner            0.000164
faire             0.000099
terrain           0.000082
fonctionnaires    0.000077
non                    NaN
objectifs              NaN
permettre              NaN
Name: pouvoir, dtype: float32

faire


faire             0.000951
confiance         0.000400
travail           0.000211
tout              0.000163
faut              0.000152
fonctionnaires    0.000127
terrain           0.000106
pouvoir           0.000099
non                    NaN
decision               NaN
Name: faire, dtype: float32

autonomie


autonomie         0.000971
donner            0.000187
fonctionnaire     0.000145
faut              0.000132
fonctionnaires    0.000120
terrain           0.000116
non                    NaN
decision               NaN
objectifs              NaN
permettre              NaN
Name: autonomie, dtype: float32

faut


faut              0.001098
donner            0.000202
fonctionnaires    0.000164
faire             0.000152
terrain           0.000138
autonomie         0.000132
non                    NaN
decision               NaN
objectifs              NaN
permettre              NaN
Name: faut, dtype: float32

donner


donner            0.001362
moyens            0.000302
faut              0.000202
autonomie         0.000187
pouvoir           0.000164
fonctionnaires    0.000115
non                    NaN
decision               NaN
objectifs              NaN
permettre              NaN
Name: donner, dtype: float32

fonctionnaire


fonctionnaire    0.001408
terrain          0.000253
autonomie        0.000145
non                   NaN
decision              NaN
objectifs             NaN
permettre             NaN
sais                  NaN
compte                NaN
fonction              NaN
Name: fonctionnaire, dtype: float32

decision


decision     0.001524
pouvoir      0.000350
non               NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
donnant           NaN
terrain           NaN
Name: decision, dtype: float32

formation


formation    0.0016
non             NaN
decision        NaN
objectifs       NaN
permettre       NaN
sais            NaN
compte          NaN
fonction        NaN
donnant         NaN
pouvoir         NaN
Name: formation, dtype: float32

confiance


confiance    0.001623
faire        0.000400
non               NaN
decision          NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
donnant           NaN
Name: confiance, dtype: float32

non


non               0.001647
oui               0.000363
fonctionnaires    0.000151
decision               NaN
objectifs              NaN
permettre              NaN
sais                   NaN
compte                 NaN
fonction               NaN
donnant                NaN
Name: non, dtype: float32

tout


tout              0.001678
faire             0.000163
fonctionnaires    0.000132
non                    NaN
decision               NaN
objectifs              NaN
permettre              NaN
sais                   NaN
compte                 NaN
fonction               NaN
Name: tout, dtype: float32

cas


cas          0.001764
pouvoir      0.000166
non               NaN
decision          NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
donnant           NaN
Name: cas, dtype: float32

travail


travail           0.001838
faire             0.000211
fonctionnaires    0.000150
non                    NaN
decision               NaN
objectifs              NaN
permettre              NaN
sais                   NaN
compte                 NaN
fonction               NaN
Name: travail, dtype: float32

decisions


decisions    0.001919
prendre      0.000784
non               NaN
decision          NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
donnant           NaN
Name: decisions, dtype: float32

donnant


donnant      0.001984
moyens       0.000428
non               NaN
decision          NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
pouvoir           NaN
Name: donnant, dtype: float32

responsabilisant


responsabilisant    0.001988
non                      NaN
decision                 NaN
objectifs                NaN
permettre                NaN
sais                     NaN
compte                   NaN
fonction                 NaN
donnant                  NaN
pouvoir                  NaN
Name: responsabilisant, dtype: float32

controle


controle     0.001996
non               NaN
decision          NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
donnant           NaN
pouvoir           NaN
Name: controle, dtype: float32

services


services     0.002028
non               NaN
decision          NaN
objectifs         NaN
permettre         NaN
sais              NaN
compte            NaN
fonction          NaN
donnant           NaN
pouvoir           NaN
Name: services, dtype: float32

In [100]:
gc.collect()

285

# Question 18 :   Faut-il revoir le fonctionnement et la formation de l'administration ?

In [101]:
question_18 = "Faut-il revoir le fonctionnement et la formation de l'administration ?"
qu_18,df_qu_18_one_hot,df_cov_18,df_confidence_18,df_lift_18 = compute_similarities(question_18, new_res)

In [102]:
for i in df_qu_18_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_18[i].sort_values(ascending=False).head(10))

oui


oui    23090
non        0
Name: oui, dtype: uint16

non


non    2604
oui       0
Name: non, dtype: uint16

In [103]:
for i in df_qu_18_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_18[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [104]:
for i in df_qu_18_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_18[i].sort_values(ascending=False).head(10))

oui


oui    0.000043
non         NaN
Name: oui, dtype: float32

non


non    0.000384
oui         NaN
Name: non, dtype: float32

In [105]:
gc.collect()

14

# Question 19 :  Si oui, comment ?

In [106]:
question_19 = "Si oui, comment ?_admin"
qu_19,df_qu_19_one_hot,df_cov_19,df_confidence_19,df_lift_19 = compute_similarities(question_19, new_res)

In [107]:
for i in df_qu_19_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_19[i].sort_values(ascending=False).head(10))

fonctionnaires


fonctionnaires    3579
formation          590
administration     568
hauts              557
faut               530
prive              492
faire              472
service            410
tous               382
fonction           375
Name: fonctionnaires, dtype: uint16

formation


formation         2830
fonctionnaires     590
administration     408
agents             333
faut               322
continue           317
faire              285
service            277
fonctionnement     252
tout               250
Name: formation, dtype: uint16

administration


administration    2301
fonctionnaires     568
formation          408
faut               397
service            364
faire              326
prive              303
fonctionnement     267
tout               251
non                241
Name: administration, dtype: uint16

faut


faut              1759
fonctionnaires     530
administration     397
formation          322
faire              296
tout               240
service            234
prive              210
services           203
tous               194
Name: faut, dtype: uint16

service


service           1742
public             575
fonctionnaires     410
administration     364
formation          277
non                262
faire              243
faut               234
agents             229
services           202
Name: service, dtype: uint16

faire


faire             1734
fonctionnaires     472
administration     326
faut               296
formation          285
service            243
tout               243
prive              240
travail            218
non                210
Name: faire, dtype: uint16

prive


prive             1704
fonctionnaires     492
public             427
administration     303
secteur            252
formation          243
faire              240
fonction           239
fonctionnaire      234
statut             233
Name: prive, dtype: uint16

services


services          1506
publics            333
fonctionnaires     292
administration     230
formation          209
faut               203
agents             203
service            202
tous               196
faire              193
Name: services, dtype: uint16

agents


agents            1483
formation          333
service            229
administration     224
fonctionnaires     219
services           203
public             197
faut               181
faire              176
fonction           167
Name: agents, dtype: uint16

tout


tout              1328
fonctionnaires     309
administration     251
formation          250
faire              243
faut               240
service            174
monde              171
prive              165
fonctionnaire      164
Name: tout, dtype: uint16

public


public            1326
service            575
prive              427
fonctionnaires     358
formation          247
administration     231
agents             197
faut               186
faire              185
fonction           164
Name: public, dtype: uint16

ena


ena               1297
supprimer          436
fonctionnaires     367
administration     235
formation          210
prive              197
hauts              184
suppression        176
ecoles             144
fonction           143
Name: ena, dtype: uint16

non


non               1281
fonctionnaires     365
service            262
administration     241
formation          222
faire              210
faut               181
fonction           166
prive              162
public             156
Name: non, dtype: uint16

supprimer


supprimer         1263
ena                436
fonctionnaires     334
prive              169
administration     164
faut               155
statut             150
vie                146
fonctionnaire      136
faire              136
Name: supprimer, dtype: uint16

tous


tous              1205
fonctionnaires     382
administration     221
formation          213
services           196
faut               194
faire              188
agents             164
service            162
prive              154
Name: tous, dtype: uint16

fonction


fonction          1181
publique           729
fonctionnaires     375
prive              239
formation          238
concours           215
administration     195
faut               179
faire              178
service            170
Name: fonction, dtype: uint16

travail


travail           1150
fonctionnaires     344
faire              218
prive              193
temps              188
formation          174
administration     170
faut               167
fonctionnaire      148
agents             144
Name: travail, dtype: uint16

fonctionnaire


fonctionnaire     1139
statut             342
fonctionnaires     281
prive              234
administration     184
formation          177
service            174
vie                173
tout               164
fonction           163
Name: fonctionnaire, dtype: uint16

terrain


terrain           1098
fonctionnaires     306
formation          237
administration     137
faut               128
faire              127
agents             120
ena                117
cas                  0
travailler           0
Name: terrain, dtype: uint16

vie


vie               1011
emploi             379
fonctionnaires     350
prive              214
fonctionnaire      173
administration     163
formation          155
statut             148
supprimer          146
fonction           139
Name: vie, dtype: uint16

In [108]:
for i in df_qu_19_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_19[i].sort_values(ascending=False).head(10))

fonctionnaires


fonctionnaires    1.000000
hauts             0.948893
nombre            0.465659
devraient         0.415902
formes            0.406143
fonctions         0.393795
remuneration      0.387454
carriere          0.385749
secteur           0.362500
postes            0.361702
Name: fonctionnaires, dtype: float32

formation


formation         1.000000
continue          0.908309
meilleure         0.398649
carriere          0.316953
accueil           0.296392
besoins           0.281579
fonctionnement    0.274211
niveau            0.255613
revoir            0.251863
poste             0.239669
Name: formation, dtype: float32

administration


administration    1.000000
citoyen           0.311579
fonctionnement    0.290533
entreprise        0.260042
faut              0.225696
cas               0.225383
citoyens          0.214640
service           0.208955
pouvoir           0.206687
temps             0.205696
Name: administration, dtype: float32

faut


faut              1.000000
revoir            0.263785
arreter           0.208092
pouvoir           0.186930
exemple           0.185714
tout              0.180723
fonctionnement    0.173014
administration    0.172534
faire             0.170704
publique          0.166851
Name: faut, dtype: float32

service


service           1.000000
public            0.433635
qualite           0.368580
sens              0.345572
citoyen           0.334737
citoyens          0.249380
non               0.204528
publics           0.202783
publique          0.186740
administration    0.158192
Name: service, dtype: float32

faire


faire       1.000000
temps       0.216772
ans         0.210417
arreter     0.196532
travail     0.189565
tout        0.182982
exemple     0.179221
mieux       0.174242
faut        0.168277
publique    0.166851
Name: faire, dtype: float32

prive


prive            1.000000
secteur          0.787500
public           0.322021
statut           0.310667
ans              0.260417
emploi           0.250321
publique         0.235359
vie              0.211672
merite           0.210821
fonctionnaire    0.205443
Name: prive, dtype: float32

services


services           1.000000
publics            0.662028
tous               0.162656
exemple            0.161039
citoyens           0.151365
fonctionnement     0.144723
nombre             0.138736
agents             0.136885
administrations    0.132797
service            0.115959
Name: services, dtype: float32

agents


agents      1.000000
publics     0.214712
former      0.194969
mieux       0.174242
publique    0.156906
public      0.148567
nombre      0.146978
fonction    0.141406
tous        0.136100
services    0.134794
Name: agents, dtype: float32

tout


tout             1.000000
monde            0.451187
temps            0.175633
exemple          0.145455
fonctionnaire    0.143986
faire            0.140138
faut             0.136441
vie              0.133531
travail          0.124348
tous             0.123651
Name: tout, dtype: float32

public


public           1.000000
service          0.330080
prive            0.250587
sens             0.224622
statut           0.166667
publique         0.156906
fonction         0.138865
fonctionnaire    0.136084
concours         0.133630
agents           0.132839
Name: public, dtype: float32

ena


ena            1.000000
ecole          0.448148
suppression    0.411215
ecoles         0.397790
supprimer      0.345210
hauts          0.313458
recrutement    0.198230
publique       0.146961
fonction       0.121084
concours       0.115813
Name: ena, dtype: float32

non


non              1.000000
competences      0.160420
service          0.150402
statut           0.148000
concours         0.145880
fonction         0.140559
publique         0.132597
fonctionnaire    0.131694
travail          0.125217
vie              0.124629
Name: non, dtype: float32

supprimer


supprimer        1.000000
ena              0.336160
postes           0.219313
statut           0.200000
emploi           0.168164
vie              0.144411
concours         0.123608
fonctionnaire    0.119403
tous             0.111203
fonction         0.108383
Name: supprimer, dtype: float32

tous


tous               1.000000
ans                0.302083
exemple            0.155844
publique           0.137017
services           0.130146
fonction           0.127011
administrations    0.115694
tout               0.112199
non                0.110851
agents             0.110587
Name: tous, dtype: float32

fonction


fonction         1.000000
publique         0.805525
concours         0.239421
ans              0.227083
recrutement      0.221239
statut           0.218667
competences      0.181409
emploi           0.147625
fonctionnaire    0.143108
prive            0.140258
Name: fonction, dtype: float32

travail


travail            1.000000
temps              0.297468
fonctionnaire      0.129939
publique           0.125967
faire              0.125721
fonction           0.120237
prive              0.113263
administrations    0.112676
non                0.112412
vie                0.110781
Name: travail, dtype: float32

fonctionnaire


fonctionnaire    1.000000
statut           0.456000
emploi           0.178434
vie              0.171118
pouvoir          0.164134
publique         0.154696
concours         0.139198
fonction         0.138019
prive            0.137324
travail          0.128696
Name: fonctionnaire, dtype: float32

terrain


terrain           1.000000
ena               0.090208
fonctionnaires    0.085499
formation         0.083746
agents            0.080917
faire             0.073241
faut              0.072769
administration    0.059539
cas               0.000000
travailler        0.000000
Name: terrain, dtype: float32

vie


vie              1.000000
emploi           0.486521
fin              0.325513
statut           0.197333
fonctionnaire    0.151888
prive            0.125587
fonction         0.117697
supprimer        0.115598
publique         0.113812
tout             0.101657
Name: vie, dtype: float32

In [109]:
for i in df_qu_19_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_19[i].sort_values(ascending=False).head(10))

fonctionnaires


fonctionnaires    0.000279
hauts             0.000265
nombre            0.000130
devraient         0.000116
formes            0.000113
fonctions         0.000110
remuneration      0.000108
carriere          0.000108
secteur           0.000101
postes            0.000101
Name: fonctionnaires, dtype: float32

formation


formation         0.000353
continue          0.000321
meilleure         0.000141
carriere          0.000112
accueil           0.000105
besoins           0.000099
fonctionnement    0.000097
niveau            0.000090
revoir            0.000089
poste             0.000085
Name: formation, dtype: float32

administration


administration    0.000435
citoyen           0.000135
fonctionnement    0.000126
entreprise        0.000113
faut              0.000098
cas               0.000098
citoyens          0.000093
service           0.000091
pouvoir           0.000090
temps             0.000089
Name: administration, dtype: float32

faut


faut              0.000569
revoir            0.000150
arreter           0.000118
pouvoir           0.000106
exemple           0.000106
tout              0.000103
fonctionnement    0.000098
administration    0.000098
faire             0.000097
publique          0.000095
Name: faut, dtype: float32

service


service           0.000574
public            0.000249
qualite           0.000212
sens              0.000198
citoyen           0.000192
citoyens          0.000143
non               0.000117
publics           0.000116
publique          0.000107
administration    0.000091
Name: service, dtype: float32

faire


faire       0.000577
temps       0.000125
ans         0.000121
arreter     0.000113
travail     0.000109
tout        0.000106
exemple     0.000103
mieux       0.000100
faut        0.000097
publique    0.000096
Name: faire, dtype: float32

prive


prive            0.000587
secteur          0.000462
public           0.000189
statut           0.000182
ans              0.000153
emploi           0.000147
publique         0.000138
vie              0.000124
merite           0.000124
fonctionnaire    0.000121
Name: prive, dtype: float32

services


services           0.000664
publics            0.000440
tous               0.000108
exemple            0.000107
citoyens           0.000101
fonctionnement     0.000096
nombre             0.000092
agents             0.000091
administrations    0.000088
service            0.000077
Name: services, dtype: float32

agents


agents      0.000674
publics     0.000145
former      0.000131
mieux       0.000117
publique    0.000106
public      0.000100
nombre      0.000099
fonction    0.000095
tous        0.000092
services    0.000091
Name: agents, dtype: float32

tout


tout             0.000753
monde            0.000340
temps            0.000132
exemple          0.000110
fonctionnaire    0.000108
faire            0.000106
faut             0.000103
vie              0.000101
travail          0.000094
tous             0.000093
Name: tout, dtype: float32

public


public           0.000754
service          0.000249
prive            0.000189
sens             0.000169
statut           0.000126
publique         0.000118
fonction         0.000105
fonctionnaire    0.000103
concours         0.000101
agents           0.000100
Name: public, dtype: float32

ena


ena            0.000771
ecole          0.000346
suppression    0.000317
ecoles         0.000307
supprimer      0.000266
hauts          0.000242
recrutement    0.000153
publique       0.000113
fonction       0.000093
concours       0.000089
Name: ena, dtype: float32

non


non              0.000781
competences      0.000125
service          0.000117
statut           0.000116
concours         0.000114
fonction         0.000110
publique         0.000104
fonctionnaire    0.000103
travail          0.000098
vie              0.000097
Name: non, dtype: float32

supprimer


supprimer        0.000792
ena              0.000266
postes           0.000174
statut           0.000158
emploi           0.000133
vie              0.000114
concours         0.000098
fonctionnaire    0.000095
tous             0.000088
fonction         0.000086
Name: supprimer, dtype: float32

tous


tous               0.000830
ans                0.000251
exemple            0.000129
publique           0.000114
services           0.000108
fonction           0.000105
administrations    0.000096
tout               0.000093
non                0.000092
agents             0.000092
Name: tous, dtype: float32

fonction


fonction         0.000847
publique         0.000682
concours         0.000203
ans              0.000192
recrutement      0.000187
statut           0.000185
competences      0.000154
emploi           0.000125
fonctionnaire    0.000121
prive            0.000119
Name: fonction, dtype: float32

travail


travail            0.000870
temps              0.000259
fonctionnaire      0.000113
publique           0.000110
faire              0.000109
fonction           0.000105
prive              0.000098
administrations    0.000098
non                0.000098
vie                0.000096
Name: travail, dtype: float32

fonctionnaire


fonctionnaire    0.000878
statut           0.000400
emploi           0.000157
vie              0.000150
pouvoir          0.000144
publique         0.000136
concours         0.000122
fonction         0.000121
prive            0.000121
travail          0.000113
Name: fonctionnaire, dtype: float32

terrain


terrain           0.000911
ena               0.000082
fonctionnaires    0.000078
formation         0.000076
agents            0.000074
faire             0.000067
faut              0.000066
administration    0.000054
non                    NaN
eviter                 NaN
Name: terrain, dtype: float32

vie


vie              0.000989
emploi           0.000481
fin              0.000322
statut           0.000195
fonctionnaire    0.000150
prive            0.000124
fonction         0.000116
supprimer        0.000114
publique         0.000113
tout             0.000101
Name: vie, dtype: float32

In [110]:
gc.collect()

147

# Question 20:  Comment l'Etat et les collectivités territoriales peuvent-ils s'améliorer pour mieux répondre aux défis de nos territoires les plus en difficulté ?

In [111]:
question_20 = "Comment l'Etat et les collectivités territoriales peuvent-ils s'améliorer pour mieux répondre aux défis de nos territoires les plus en difficulté ?"
qu_20,df_qu_20_one_hot,df_cov_20,df_confidence_20,df_lift_20 = compute_similarities(question_20, new_res)

In [112]:
for i in df_qu_20_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_20[i].sort_values(ascending=False).head(10))

services


services       3093
publics        1334
territoires     518
proximite       398
maisons         367
tous            358
faut            346
faire           302
service         300
public          293
Name: services, dtype: uint16

territoires


territoires      2547
services          518
difficulte        418
faut              343
publics           309
difficultes       281
faire             267
collectivites     240
tous              233
ruraux            216
Name: territoires, dtype: uint16

faire


faire            1714
services          302
tout              287
faut              272
territoires       267
tous              201
citoyens          195
collectivites     179
publics           169
service           159
Name: faire, dtype: uint16

publics


publics        1558
services       1334
territoires     309
maisons         233
faut            203
tous            193
proximite       180
service         178
faire           169
tout            161
Name: publics, dtype: uint16

faut


faut             1554
services          346
territoires       343
faire             272
tout              251
publics           203
collectivites     194
territoire        189
tous              180
communes          173
Name: faut, dtype: uint16

citoyens


citoyens       1445
services        217
faire           195
territoires     186
faut            165
tous            141
ecoute          139
service         132
elus            129
tout            129
Name: citoyens, dtype: uint16

collectivites


collectivites    1441
territoriales     608
locales           247
territoires       240
services          209
faut              194
moyens            186
faire             179
tout              152
communes          143
Name: collectivites, dtype: uint16

tout


tout             1334
faire             287
services          273
faut              251
territoires       213
territoire        211
tous              163
publics           161
collectivites     152
monde             149
Name: tout, dtype: uint16

communes


communes        1268
services         283
petites          262
regions          219
departements     188
faut             173
supprimer        166
commune          157
region           147
faire            146
Name: communes, dtype: uint16

tous


tous           1145
services        358
territoires     233
faire           201
publics         193
faut            180
tout            163
citoyens        141
acces           122
territoire      120
Name: tous, dtype: uint16

territoire


territoire       1117
services          246
territoires       215
tout              211
faut              189
publics           155
faire             155
difficulte        136
collectivites     126
tous              120
Name: territoire, dtype: uint16

service


service        1099
public          541
services        300
publics         178
maisons         176
faire           159
faut            153
territoires     142
tout            136
citoyens        132
Name: service, dtype: uint16

terrain


terrain        1094
elus            114
faire           114
citoyens        104
territoires     103
proximite         0
regions           0
petites           0
publics           0
communes          0
Name: terrain, dtype: uint16

moyens


moyens           1091
territoires       207
donner            203
collectivites     186
services          167
faut              144
faire             129
communes          120
mettre            108
publics           103
Name: moyens, dtype: uint16

regions


regions          1006
communes          219
departements      217
territoires       155
faut              140
services          133
faire             132
region            132
collectivites     113
tout              113
Name: regions, dtype: uint16

public


public         933
service        541
services       293
maisons        180
publics        154
faire          132
faut           124
territoires    121
tout           104
tous           103
Name: public, dtype: uint16

proximite


proximite      929
services       398
publics        180
territoires    112
service        107
meilleure        0
emploi           0
regions          0
petites          0
communes         0
Name: proximite, dtype: uint16

non


non              902
services         152
territoires      146
faire            142
faut             138
tout             115
collectivites    104
projets            0
elus               0
rurales            0
Name: non, dtype: uint16

fonctionnaires


fonctionnaires     889
services           155
faire              141
territoires        127
nombre             104
faut               102
politiques           0
administratives      0
petites              0
publics              0
Name: fonctionnaires, dtype: uint16

mieux


mieux            872
territoires      150
services         136
faire            131
collectivites    110
projets            0
elus               0
rurales            0
prendre            0
decisions          0
Name: mieux, dtype: uint16

In [113]:
for i in df_qu_20_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_20[i].sort_values(ascending=False).head(10))

services


services        1.000000
publics         0.856226
itinerants      0.755725
maisons         0.625213
publiques       0.541538
poste           0.532995
bus             0.469649
regroupement    0.457364
regrouper       0.438247
rurales         0.429907
Name: services, dtype: float32

territoires


territoires      1.000000
ruraux           0.710526
difficulte       0.601439
difficultes      0.418778
entreprises      0.285088
developpement    0.272727
grandes          0.251029
aider            0.243852
villes           0.238550
habitants        0.237991
Name: territoires, dtype: float32

faire


faire        1.000000
economies    0.438735
temps        0.282051
travail      0.221239
tout         0.215142
vie          0.202335
mettre       0.183771
exemple      0.183411
tous         0.175546
faut         0.175032
Name: faire, dtype: float32

publics


publics       1.000000
itinerants    0.438931
services      0.431296
maisons       0.396934
poste         0.302030
transports    0.245387
acces         0.229342
zones         0.207232
proximite     0.193757
agents        0.187500
Name: publics, dtype: float32

faut


faut           1.000000
france         0.230608
tout           0.188156
exemple        0.183411
difficulte     0.182734
region         0.174629
territoire     0.169203
mettre         0.168258
pouvoir        0.167692
difficultes    0.160954
Name: faut, dtype: float32

citoyens


citoyens    1.000000
ecoute      0.219589
elus        0.174089
besoins     0.153846
mettre      0.132458
tous        0.123144
service     0.120109
faire       0.113769
faut        0.106178
tout        0.096702
Name: citoyens, dtype: float32

collectivites


collectivites    1.000000
territoriales    0.873563
locales          0.449909
donner           0.176991
moyens           0.170486
exemple          0.136682
mieux            0.126147
faut             0.124839
supprimer        0.123636
non              0.115299
Name: collectivites, dtype: float32

tout


tout          1.000000
monde         0.526502
territoire    0.188899
arreter       0.172176
exemple       0.171729
faire         0.167445
faut          0.161519
internet      0.143045
tous          0.142358
mettre        0.139618
Name: tout, dtype: float32

communes


communes        1.000000
petites         0.540206
regroupement    0.434109
departements    0.406048
commune         0.331924
departement     0.323760
habitants       0.305677
region          0.242175
regions         0.217694
nombre          0.216260
Name: communes, dtype: float32

tous


tous        1.000000
acces       0.205734
internet    0.157480
exemple     0.128505
publics     0.123877
tout        0.122189
faire       0.117270
faut        0.115830
services    0.115745
public      0.110397
Name: tous, dtype: float32

territoire


territoire       1.000000
difficulte       0.195683
tout             0.158171
exemple          0.122664
faut             0.121622
tous             0.104803
regions          0.103380
publics          0.099487
faire            0.090432
collectivites    0.087439
Name: territoire, dtype: float32

service


service      1.000000
public       0.579850
maisons      0.299830
proximite    0.115178
publics      0.114249
tout         0.101949
faut         0.098456
services     0.096993
tous         0.094323
faire        0.092765
Name: service, dtype: float32

terrain


terrain        1.000000
elus           0.153846
citoyens       0.071972
faire          0.066511
territoires    0.040440
proximite      0.000000
regions        0.000000
petites        0.000000
publics        0.000000
communes       0.000000
Name: terrain, dtype: float32

moyens


moyens           1.000000
donner           0.299410
collectivites    0.129077
mettre           0.128878
communes         0.094637
faut             0.092664
territoires      0.081272
faire            0.075263
publics          0.066110
services         0.053993
Name: moyens, dtype: float32

regions


regions         1.000000
departements    0.468682
region          0.217463
grandes         0.216049
communes        0.172713
pouvoir         0.164615
supprimer       0.130909
territoire      0.093107
faut            0.090090
tout            0.084708
Name: regions, dtype: float32

public


public         1.000000
service        0.492266
maisons        0.306644
publics        0.098845
services       0.094730
tous           0.089956
faut           0.079794
tout           0.077961
faire          0.077013
territoires    0.047507
Name: public, dtype: float32

proximite


proximite      1.000000
services       0.128678
publics        0.115533
service        0.097361
territoires    0.043973
meilleure      0.000000
emploi         0.000000
regions        0.000000
petites        0.000000
communes       0.000000
Name: proximite, dtype: float32

non


non              1.000000
faut             0.088803
tout             0.086207
faire            0.082847
collectivites    0.072172
territoires      0.057322
services         0.049143
developper       0.000000
proximite        0.000000
travail          0.000000
Name: non, dtype: float32

fonctionnaires


fonctionnaires     1.000000
nombre             0.169106
faire              0.082264
faut               0.065637
services           0.050113
territoires        0.049863
projets            0.000000
administratives    0.000000
petites            0.000000
publics            0.000000
Name: fonctionnaires, dtype: float32

mieux


mieux            1.000000
faire            0.076429
collectivites    0.076336
territoires      0.058893
services         0.043970
projets          0.000000
elus             0.000000
rurales          0.000000
prendre          0.000000
decisions        0.000000
Name: mieux, dtype: float32

In [114]:
for i in df_qu_20_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_20[i].sort_values(ascending=False).head(10))

services


services        0.000323
publics         0.000277
itinerants      0.000244
maisons         0.000202
publiques       0.000175
poste           0.000172
bus             0.000152
regroupement    0.000148
regrouper       0.000142
rurales         0.000139
Name: services, dtype: float32

territoires


territoires      0.000393
ruraux           0.000279
difficulte       0.000236
difficultes      0.000164
entreprises      0.000112
developpement    0.000107
grandes          0.000099
aider            0.000096
villes           0.000094
habitants        0.000093
Name: territoires, dtype: float32

faire


faire        0.000583
economies    0.000256
temps        0.000165
travail      0.000129
tout         0.000126
vie          0.000118
mettre       0.000107
exemple      0.000107
tous         0.000102
faut         0.000102
Name: faire, dtype: float32

publics


publics       0.000642
itinerants    0.000282
services      0.000277
maisons       0.000255
poste         0.000194
transports    0.000158
acces         0.000147
zones         0.000133
proximite     0.000124
agents        0.000120
Name: publics, dtype: float32

faut


faut           0.000644
france         0.000148
tout           0.000121
exemple        0.000118
difficulte     0.000118
region         0.000112
territoire     0.000109
mettre         0.000108
pouvoir        0.000108
difficultes    0.000104
Name: faut, dtype: float32

citoyens


citoyens    0.000692
ecoute      0.000152
elus        0.000120
besoins     0.000106
mettre      0.000092
tous        0.000085
service     0.000083
faire       0.000079
faut        0.000073
tout        0.000067
Name: citoyens, dtype: float32

collectivites


collectivites    0.000694
territoriales    0.000606
locales          0.000312
donner           0.000123
moyens           0.000118
exemple          0.000095
mieux            0.000088
faut             0.000087
supprimer        0.000086
non              0.000080
Name: collectivites, dtype: float32

tout


tout          0.000750
monde         0.000395
territoire    0.000142
arreter       0.000129
exemple       0.000129
faire         0.000126
faut          0.000121
internet      0.000107
tous          0.000107
mettre        0.000105
Name: tout, dtype: float32

communes


communes        0.000789
petites         0.000426
regroupement    0.000342
departements    0.000320
commune         0.000262
departement     0.000255
habitants       0.000241
region          0.000191
regions         0.000172
nombre          0.000171
Name: communes, dtype: float32

tous


tous        0.000873
acces       0.000180
internet    0.000138
exemple     0.000112
publics     0.000108
tout        0.000107
faire       0.000102
faut        0.000101
services    0.000101
public      0.000096
Name: tous, dtype: float32

territoire


territoire       0.000895
difficulte       0.000175
tout             0.000142
exemple          0.000110
faut             0.000109
tous             0.000094
regions          0.000093
publics          0.000089
faire            0.000081
collectivites    0.000078
Name: territoire, dtype: float32

service


service      0.000910
public       0.000528
maisons      0.000273
proximite    0.000105
publics      0.000104
tout         0.000093
faut         0.000090
services     0.000088
tous         0.000086
faire        0.000084
Name: service, dtype: float32

terrain


terrain        0.000914
elus           0.000141
citoyens       0.000066
faire          0.000061
territoires    0.000037
non                 NaN
decision            NaN
eviter              NaN
numerique           NaN
permettre           NaN
Name: terrain, dtype: float32

moyens


moyens           0.000917
donner           0.000274
collectivites    0.000118
mettre           0.000118
communes         0.000087
faut             0.000085
territoires      0.000074
faire            0.000069
publics          0.000061
services         0.000049
Name: moyens, dtype: float32

regions


regions         0.000994
departements    0.000466
region          0.000216
grandes         0.000215
communes        0.000172
pouvoir         0.000164
supprimer       0.000130
territoire      0.000093
faut            0.000090
tout            0.000084
Name: regions, dtype: float32

public


public         0.001072
service        0.000528
maisons        0.000329
publics        0.000106
services       0.000102
tous           0.000096
faut           0.000086
tout           0.000084
faire          0.000083
territoires    0.000051
Name: public, dtype: float32

proximite


proximite      0.001076
services       0.000139
publics        0.000124
service        0.000105
territoires    0.000047
non                 NaN
decision            NaN
eviter              NaN
numerique           NaN
permettre           NaN
Name: proximite, dtype: float32

non


non              0.001109
faut             0.000098
tout             0.000096
faire            0.000092
collectivites    0.000080
territoires      0.000064
services         0.000054
decision              NaN
eviter                NaN
numerique             NaN
Name: non, dtype: float32

fonctionnaires


fonctionnaires    0.001125
nombre            0.000190
faire             0.000093
faut              0.000074
services          0.000056
territoires       0.000056
non                    NaN
decision               NaN
eviter                 NaN
numerique              NaN
Name: fonctionnaires, dtype: float32

mieux


mieux            0.001147
faire            0.000088
collectivites    0.000088
territoires      0.000068
services         0.000050
non                   NaN
decision              NaN
eviter                NaN
numerique             NaN
permettre             NaN
Name: mieux, dtype: float32

In [115]:
gc.collect()

147

# Question 21: Si vous avez été amené à chercher une formation, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [116]:
question_21 = "Si vous avez été amené à chercher une formation, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_21,df_qu_21_one_hot,df_cov_21,df_confidence_21,df_lift_21 = compute_similarities(question_21, new_res)

In [117]:
for i in df_qu_21_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_21[i].sort_values(ascending=False).head(10))

formation


formation          2558
emploi              977
pole                858
formations          486
faire               333
ans                 238
trouver             218
demande             214
tout                213
professionnelle     212
Name: formation, dtype: uint16

emploi


emploi        1770
pole          1549
formation      977
formations     446
faire          233
demande        168
aide           165
ans            159
tout           148
trouver        146
Name: emploi, dtype: uint16

pole


pole           1582
emploi         1549
formation       858
formations      377
faire           198
demande         160
aide            154
ans             132
financement     131
tout            124
Name: pole, dtype: uint16

formations


formations     1198
formation       486
emploi          446
pole            377
faire           147
trouver         113
faut            112
demande           0
tout              0
financement       0
Name: formations, dtype: uint16

non


non            984
concerne       305
formation      194
emploi         135
pole           117
jamais           0
financement      0
travail          0
tout             0
demande          0
Name: non, dtype: uint16

concerne


concerne       633
non            305
jamais           0
financement      0
emploi           0
pole             0
travail          0
tout             0
formation        0
demande          0
Name: concerne, dtype: uint16

faire


faire          512
formation      333
emploi         233
pole           198
formations     147
demande          0
financement      0
travail          0
tout             0
ans              0
Name: faire, dtype: uint16

tout


tout           388
formation      213
emploi         148
pole           124
demande          0
jamais           0
financement      0
travail          0
ans              0
faut             0
Name: tout, dtype: uint16

trouver


trouver        380
formation      218
emploi         146
pole           124
formations     113
demande          0
financement      0
travail          0
tout             0
ans              0
Name: trouver, dtype: uint16

ans


ans            372
formation      238
emploi         159
pole           132
jamais           0
financement      0
travail          0
tout             0
demande          0
faut             0
Name: ans, dtype: uint16

faut


faut           355
formation      193
emploi         131
formations     112
pole           108
demande          0
financement      0
travail          0
tout             0
ans              0
Name: faut, dtype: uint16

demande


demande        308
formation      214
emploi         168
pole           160
jamais           0
financement      0
travail          0
tout             0
ans              0
faut             0
Name: demande, dtype: uint16

financement


financement    307
formation      179
emploi         146
pole           131
demande          0
jamais           0
travail          0
tout             0
ans              0
faut             0
Name: financement, dtype: uint16

aide


aide           294
formation      176
emploi         165
pole           154
demande          0
jamais           0
financement      0
travail          0
tout             0
ans              0
Name: aide, dtype: uint16

travail


travail        286
formation      184
emploi         125
pole           104
demande          0
jamais           0
financement      0
tout             0
ans              0
faut             0
Name: travail, dtype: uint16

professionnelle


professionnelle    268
formation          212
demande              0
jamais               0
financement          0
emploi               0
pole                 0
travail              0
tout                 0
ans                  0
Name: professionnelle, dtype: uint16

jamais


jamais         257
formation      140
demande          0
financement      0
emploi           0
pole             0
travail          0
tout             0
ans              0
faut             0
Name: jamais, dtype: uint16

In [118]:
for i in df_qu_21_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_21[i].sort_values(ascending=False).head(10))

formation


formation          1.000000
professionnelle    0.791045
demande            0.694805
faire              0.650391
travail            0.643357
ans                0.639785
aide               0.598639
financement        0.583062
trouver            0.573684
emploi             0.551977
Name: formation, dtype: float32

emploi


emploi         1.000000
pole           0.979140
aide           0.561224
demande        0.545455
financement    0.475570
faire          0.455078
travail        0.437063
ans            0.427419
trouver        0.384211
formation      0.381939
Name: emploi, dtype: float32

pole


pole           1.000000
emploi         0.875141
aide           0.523810
demande        0.519481
financement    0.426710
faire          0.386719
travail        0.363636
ans            0.354839
formation      0.335418
trouver        0.326316
Name: pole, dtype: float32

formations


formations     1.000000
faut           0.315493
trouver        0.297368
faire          0.287109
emploi         0.251977
pole           0.238306
formation      0.189992
demande        0.000000
tout           0.000000
financement    0.000000
Name: formations, dtype: float32

non


non            1.000000
concerne       0.481833
emploi         0.076271
formation      0.075841
pole           0.073957
jamais         0.000000
financement    0.000000
travail        0.000000
tout           0.000000
demande        0.000000
Name: non, dtype: float32

concerne


concerne       1.000000
non            0.309959
jamais         0.000000
financement    0.000000
emploi         0.000000
pole           0.000000
travail        0.000000
tout           0.000000
formation      0.000000
demande        0.000000
Name: concerne, dtype: float32

faire


faire          1.000000
emploi         0.131638
formation      0.130180
pole           0.125158
formations     0.122705
demande        0.000000
financement    0.000000
travail        0.000000
tout           0.000000
ans            0.000000
Name: faire, dtype: float32

tout


tout           1.000000
emploi         0.083616
formation      0.083268
pole           0.078382
demande        0.000000
jamais         0.000000
financement    0.000000
travail        0.000000
ans            0.000000
faut           0.000000
Name: tout, dtype: float32

trouver


trouver        1.000000
formations     0.094324
formation      0.085223
emploi         0.082486
pole           0.078382
demande        0.000000
financement    0.000000
travail        0.000000
tout           0.000000
ans            0.000000
Name: trouver, dtype: float32

ans


ans            1.000000
formation      0.093041
emploi         0.089831
pole           0.083439
jamais         0.000000
financement    0.000000
travail        0.000000
tout           0.000000
demande        0.000000
faut           0.000000
Name: ans, dtype: float32

faut


faut           1.000000
formations     0.093489
formation      0.075450
emploi         0.074011
pole           0.068268
demande        0.000000
financement    0.000000
travail        0.000000
tout           0.000000
ans            0.000000
Name: faut, dtype: float32

demande


demande        1.000000
pole           0.101138
emploi         0.094915
formation      0.083659
jamais         0.000000
financement    0.000000
travail        0.000000
tout           0.000000
ans            0.000000
faut           0.000000
Name: demande, dtype: float32

financement


financement    1.000000
pole           0.082807
emploi         0.082486
formation      0.069977
demande        0.000000
jamais         0.000000
travail        0.000000
tout           0.000000
ans            0.000000
faut           0.000000
Name: financement, dtype: float32

aide


aide           1.000000
pole           0.097345
emploi         0.093220
formation      0.068804
demande        0.000000
jamais         0.000000
financement    0.000000
travail        0.000000
tout           0.000000
ans            0.000000
Name: aide, dtype: float32

travail


travail        1.000000
formation      0.071931
emploi         0.070621
pole           0.065740
demande        0.000000
jamais         0.000000
financement    0.000000
tout           0.000000
ans            0.000000
faut           0.000000
Name: travail, dtype: float32

professionnelle


professionnelle    1.000000
formation          0.082877
demande            0.000000
jamais             0.000000
financement        0.000000
emploi             0.000000
pole               0.000000
travail            0.000000
tout               0.000000
ans                0.000000
Name: professionnelle, dtype: float32

jamais


jamais         1.00000
formation      0.05473
demande        0.00000
financement    0.00000
emploi         0.00000
pole           0.00000
travail        0.00000
tout           0.00000
ans            0.00000
faut           0.00000
Name: jamais, dtype: float32

In [119]:
for i in df_qu_21_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_21[i].sort_values(ascending=False).head(10))

formation


formation          0.000391
professionnelle    0.000309
demande            0.000272
faire              0.000254
travail            0.000252
ans                0.000250
aide               0.000234
financement        0.000228
trouver            0.000224
emploi             0.000216
Name: formation, dtype: float32

emploi


emploi         0.000565
pole           0.000553
aide           0.000317
demande        0.000308
financement    0.000269
faire          0.000257
travail        0.000247
ans            0.000241
trouver        0.000217
formation      0.000216
Name: emploi, dtype: float32

pole


pole           0.000632
emploi         0.000553
aide           0.000331
demande        0.000328
financement    0.000270
faire          0.000244
travail        0.000230
ans            0.000224
formation      0.000212
trouver        0.000206
Name: pole, dtype: float32

formations


formations     0.000835
faut           0.000263
trouver        0.000248
faire          0.000240
emploi         0.000210
pole           0.000199
formation      0.000159
non                 NaN
financement         NaN
travail             NaN
Name: formations, dtype: float32

non


non            0.001016
concerne       0.000490
emploi         0.000078
formation      0.000077
pole           0.000075
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
ans                 NaN
Name: non, dtype: float32

concerne


concerne       0.00158
non            0.00049
financement        NaN
emploi             NaN
pole               NaN
travail            NaN
tout               NaN
formation          NaN
jamais             NaN
ans                NaN
Name: concerne, dtype: float32

faire


faire          0.001953
emploi         0.000257
formation      0.000254
pole           0.000244
formations     0.000240
non                 NaN
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
Name: faire, dtype: float32

tout


tout           0.002577
emploi         0.000216
formation      0.000215
pole           0.000202
non                 NaN
financement         NaN
travail             NaN
jamais              NaN
ans                 NaN
faire               NaN
Name: tout, dtype: float32

trouver


trouver        0.002632
formations     0.000248
formation      0.000224
emploi         0.000217
pole           0.000206
non                 NaN
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
Name: trouver, dtype: float32

ans


ans            0.002688
formation      0.000250
emploi         0.000241
pole           0.000224
non                 NaN
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
faire               NaN
Name: ans, dtype: float32

faut


faut           0.002817
formations     0.000263
formation      0.000213
emploi         0.000208
pole           0.000192
non                 NaN
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
Name: faut, dtype: float32

demande


demande        0.003247
pole           0.000328
emploi         0.000308
formation      0.000272
non                 NaN
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
ans                 NaN
Name: demande, dtype: float32

financement


financement    0.003257
pole           0.000270
emploi         0.000269
formation      0.000228
non                 NaN
travail             NaN
tout                NaN
jamais              NaN
ans                 NaN
faire               NaN
Name: financement, dtype: float32

aide


aide           0.003401
pole           0.000331
emploi         0.000317
formation      0.000234
non                 NaN
financement         NaN
travail             NaN
tout                NaN
jamais              NaN
ans                 NaN
Name: aide, dtype: float32

travail


travail        0.003497
formation      0.000252
emploi         0.000247
pole           0.000230
non                 NaN
financement         NaN
tout                NaN
jamais              NaN
ans                 NaN
faire               NaN
Name: travail, dtype: float32

professionnelle


professionnelle    0.003731
formation          0.000309
non                     NaN
financement             NaN
emploi                  NaN
pole                    NaN
travail                 NaN
tout                    NaN
jamais                  NaN
ans                     NaN
Name: professionnelle, dtype: float32

jamais


jamais         0.003891
formation      0.000213
non                 NaN
financement         NaN
emploi              NaN
pole                NaN
travail             NaN
tout                NaN
ans                 NaN
faire               NaN
Name: jamais, dtype: float32

In [120]:
gc.collect()

126

# Question 22:  Si vous avez été amené à scolariser votre enfant, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [121]:
question_22 = "Si vous avez été amené à scolariser votre enfant, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_22,df_qu_22_one_hot,df_cov_22,df_confidence_22,df_lift_22 = compute_similarities(question_22, new_res)

In [122]:
for i in df_qu_22_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_22[i].sort_values(ascending=False).head(10))

enfants


enfants        1948
ecole           587
education       405
parents         321
nationale       307
enseignants     296
scolaire        289
prive           281
faire           273
enfant          242
Name: enfants, dtype: uint16

ecole


ecole          1677
enfants         587
enfant          347
publique        299
education       260
parents         243
enseignants     235
scolaire        234
primaire        232
faire           222
Name: ecole, dtype: uint16

education


education      1223
nationale       910
enfants         405
ecole           260
eleves          229
enseignants     215
enfant          181
faire           180
scolaire        175
parents         160
Name: education, dtype: uint16

enfant


enfant       1060
ecole         347
enfants       242
scolaire      186
education     181
faire         154
parents       150
nationale     134
prive         124
classe        121
Name: enfant, dtype: uint16

scolaire


scolaire         1003
carte             319
enfants           289
ecole             234
enfant            186
education         175
nationale         133
college           128
etablissement     123
eleves            122
Name: scolaire, dtype: uint16

non


non             944
concerne        223
enfants         178
ecole           146
enseignants     122
education       115
enfant          104
enseignement      0
fille             0
ans               0
Name: non, dtype: uint16

nationale


nationale      926
education      910
enfants        307
eleves         175
ecole          171
enseignants    167
enfant         134
scolaire       133
faire          130
parents        126
Name: nationale, dtype: uint16

enseignants


enseignants     861
enfants         296
ecole           235
eleves          216
education       215
nationale       167
parents         166
faire           139
enseignement    129
non             122
Name: enseignants, dtype: uint16

eleves


eleves         786
enfants        232
education      229
ecole          219
classe         218
enseignants    216
parents        183
classes        183
nationale      175
faire          157
Name: eleves, dtype: uint16

college


college        685
lycee          278
enfants        236
ecole          207
primaire       168
eleves         148
scolaire       128
enfant         119
enseignants    118
education      118
Name: college, dtype: uint16

faire


faire          668
enfants        273
ecole          222
education      180
eleves         157
enfant         154
enseignants    139
faut           132
nationale      130
parents        123
Name: faire, dtype: uint16

parents


parents        668
enfants        321
ecole          243
eleves         183
enseignants    166
education      160
enfant         150
nationale      126
faire          123
scolaire       115
Name: parents, dtype: uint16

prive


prive           636
enfants         281
public          205
ecole           177
enfant          124
enseignement    112
education       106
formation         0
travail           0
tout              0
Name: prive, dtype: uint16

ecoles


ecoles         626
enfants        233
ecole          198
education      119
enseignants    118
orientation      0
difficultes      0
systeme          0
ans              0
probleme         0
Name: ecoles, dtype: uint16

lycee


lycee          612
college        278
enfants        168
ecole          141
eleves         109
orientation      0
difficultes      0
systeme          0
ans              0
probleme         0
Name: lycee, dtype: uint16

faut


faut           542
enfants        219
ecole          198
faire          132
education      132
eleves         117
enseignants    108
enfant         106
tout           104
ans              0
Name: faut, dtype: uint16

tout


tout         535
enfants      196
ecole        175
education    135
faire        117
enfant       113
nationale    109
faut         104
eleves       104
formation      0
Name: tout, dtype: uint16

difficulte


difficulte     530
enfants        160
ecole          108
professeurs      0
difficultes      0
systeme          0
ans              0
probleme         0
etudes           0
classe           0
Name: difficulte, dtype: uint16

classe


classe         516
eleves         218
enfants        214
ecole          178
education      131
enfant         121
enseignants    113
classes        108
faire          105
tout             0
Name: classe, dtype: uint16

enseignement


enseignement    513
enfants         172
enseignants     129
education       117
ecole           114
prive           112
qualite         105
formation         0
travail           0
tout              0
Name: enseignement, dtype: uint16

In [123]:
for i in df_qu_22_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_22[i].sort_values(ascending=False).head(10))

enfants


enfants       1.000000
3             0.500000
2             0.493333
parents       0.480539
tous          0.460177
scolarite     0.452899
maternelle    0.452055
public        0.443459
prive         0.441824
etudes        0.423221
Name: enfants, dtype: float32

ecole


ecole         1.000000
publique      0.854286
maternelle    0.547945
primaire      0.516704
mairie        0.458084
3             0.409449
fils          0.392857
ans           0.372146
faut          0.365314
parents       0.363772
Name: ecole, dtype: float32

education


education      1.000000
nationale      0.982721
eleves         0.291349
niveau         0.278373
faire          0.269461
tous           0.267699
classe         0.253876
tout           0.252336
enseignants    0.249710
professeurs    0.246094
Name: education, dtype: float32

enfant


enfant      1.000000
ans         0.267123
classe      0.234496
faire       0.230539
parents     0.224551
tout        0.211215
ecole       0.206917
faut        0.195572
prive       0.194969
scolaire    0.185444
Name: enfant, dtype: float32

scolaire


scolaire         1.000000
carte            0.924638
systeme          0.344595
etablissement    0.290094
niveau           0.218415
college          0.186861
enfant           0.175472
parents          0.172156
faire            0.166168
eleves           0.155216
Name: scolaire, dtype: float32

non


non               1.000000
concerne          0.443340
enseignants       0.141696
enfant            0.098113
education         0.094031
enfants           0.091376
ecole             0.087060
etablissements    0.000000
systeme           0.000000
probleme          0.000000
Name: non, dtype: float32

nationale


nationale      1.000000
education      0.744072
eleves         0.222646
tout           0.203738
faire          0.194611
enseignants    0.193961
parents        0.188623
enfants        0.157598
scolaire       0.132602
enfant         0.126415
Name: nationale, dtype: float32

enseignants


enseignants     1.000000
formation       0.382550
travail         0.303207
eleves          0.274809
primaire        0.256125
enseignement    0.251462
classes         0.250518
parents         0.248503
tous            0.243363
niveau          0.237687
Name: enseignants, dtype: float32

eleves


eleves         1.000000
classe         0.422481
classes        0.378882
parents        0.273952
professeurs    0.269531
niveau         0.252677
enseignants    0.250871
tous           0.236726
faire          0.235030
college        0.216058
Name: eleves, dtype: float32

college


college        1.000000
lycee          0.454248
primaire       0.374165
eleves         0.188295
enseignants    0.137050
scolaire       0.127617
ecole          0.123435
enfants        0.121150
enfant         0.112264
education      0.096484
Name: college, dtype: float32

faire


faire          1.000000
faut           0.243542
tout           0.218692
classe         0.203488
eleves         0.199746
parents        0.184132
enseignants    0.161440
education      0.147179
enfant         0.145283
nationale      0.140389
Name: faire, dtype: float32

parents


parents        1.000000
eleves         0.232824
enseignants    0.192799
faire          0.184132
enfants        0.164784
ecole          0.144902
enfant         0.141509
nationale      0.136069
education      0.130826
scolaire       0.114656
Name: parents, dtype: float32

prive


prive           1.000000
public          0.454545
enseignement    0.218324
enfants         0.144251
enfant          0.116981
ecole           0.105546
education       0.086672
formation       0.000000
travail         0.000000
tout            0.000000
Name: prive, dtype: float32

ecoles


ecoles         1.000000
enseignants    0.137050
enfants        0.119610
ecole          0.118068
education      0.097302
orientation    0.000000
difficultes    0.000000
systeme        0.000000
ans            0.000000
probleme       0.000000
Name: ecoles, dtype: float32

lycee


lycee          1.000000
college        0.405839
eleves         0.138677
enfants        0.086242
ecole          0.084079
orientation    0.000000
difficultes    0.000000
systeme        0.000000
ans            0.000000
probleme       0.000000
Name: lycee, dtype: float32

faut


faut           1.000000
faire          0.197605
tout           0.194393
eleves         0.148855
enseignants    0.125436
ecole          0.118068
enfants        0.112423
education      0.107931
enfant         0.100000
ans            0.000000
Name: faut, dtype: float32

tout


tout         1.000000
faut         0.191882
faire        0.175150
eleves       0.132316
nationale    0.117711
education    0.110384
enfant       0.106604
ecole        0.104353
enfants      0.100616
formation    0.000000
Name: tout, dtype: float32

difficulte


difficulte     1.000000
enfants        0.082136
ecole          0.064401
professeurs    0.000000
difficultes    0.000000
systeme        0.000000
ans            0.000000
probleme       0.000000
etudes         0.000000
classe         0.000000
Name: difficulte, dtype: float32

classe


classe         1.000000
eleves         0.277354
classes        0.223602
faire          0.157186
enseignants    0.131243
enfant         0.114151
enfants        0.109856
education      0.107114
ecole          0.106142
tout           0.000000
Name: classe, dtype: float32

enseignement


enseignement    1.000000
qualite         0.364583
prive           0.176101
enseignants     0.149826
education       0.095666
enfants         0.088296
ecole           0.067979
formation       0.000000
travail         0.000000
tout            0.000000
Name: enseignement, dtype: float32

In [124]:
for i in df_qu_22_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_22[i].sort_values(ascending=False).head(10))

enfants


enfants       0.000513
3             0.000257
2             0.000253
parents       0.000247
tous          0.000236
scolarite     0.000232
maternelle    0.000232
public        0.000228
prive         0.000227
etudes        0.000217
Name: enfants, dtype: float32

ecole


ecole         0.000596
publique      0.000509
maternelle    0.000327
primaire      0.000308
mairie        0.000273
3             0.000244
fils          0.000234
ans           0.000222
faut          0.000218
parents       0.000217
Name: ecole, dtype: float32

education


education      0.000818
nationale      0.000804
eleves         0.000238
niveau         0.000228
faire          0.000220
tous           0.000219
classe         0.000208
tout           0.000206
enseignants    0.000204
professeurs    0.000201
Name: education, dtype: float32

enfant


enfant      0.000943
ans         0.000252
classe      0.000221
faire       0.000217
parents     0.000212
tout        0.000199
ecole       0.000195
faut        0.000185
prive       0.000184
scolaire    0.000175
Name: enfant, dtype: float32

scolaire


scolaire         0.000997
carte            0.000922
systeme          0.000344
etablissement    0.000289
niveau           0.000218
college          0.000186
enfant           0.000175
parents          0.000172
faire            0.000166
eleves           0.000155
Name: scolaire, dtype: float32

non


non            0.001059
concerne       0.000470
enseignants    0.000150
enfant         0.000104
education      0.000100
enfants        0.000097
ecole          0.000092
carte               NaN
2                   NaN
college             NaN
Name: non, dtype: float32

nationale


nationale      0.001080
education      0.000804
eleves         0.000240
tout           0.000220
faire          0.000210
enseignants    0.000209
parents        0.000204
enfants        0.000170
scolaire       0.000143
enfant         0.000137
Name: nationale, dtype: float32

enseignants


enseignants     0.001161
formation       0.000444
travail         0.000352
eleves          0.000319
primaire        0.000297
enseignement    0.000292
classes         0.000291
parents         0.000289
tous            0.000283
niveau          0.000276
Name: enseignants, dtype: float32

eleves


eleves         0.001272
classe         0.000538
classes        0.000482
parents        0.000349
professeurs    0.000343
niveau         0.000321
enseignants    0.000319
tous           0.000301
faire          0.000299
college        0.000275
Name: eleves, dtype: float32

college


college        0.001460
lycee          0.000663
primaire       0.000546
eleves         0.000275
enseignants    0.000200
scolaire       0.000186
ecole          0.000180
enfants        0.000177
enfant         0.000164
education      0.000141
Name: college, dtype: float32

faire


faire          0.001497
faut           0.000365
tout           0.000327
classe         0.000305
eleves         0.000299
parents        0.000276
enseignants    0.000242
education      0.000220
enfant         0.000217
nationale      0.000210
Name: faire, dtype: float32

parents


parents        0.001497
eleves         0.000349
enseignants    0.000289
faire          0.000276
enfants        0.000247
ecole          0.000217
enfant         0.000212
nationale      0.000204
education      0.000196
scolaire       0.000172
Name: parents, dtype: float32

prive


prive           0.001572
public          0.000715
enseignement    0.000343
enfants         0.000227
enfant          0.000184
ecole           0.000166
education       0.000136
non                  NaN
carte                NaN
2                    NaN
Name: prive, dtype: float32

ecoles


ecoles         0.001597
enseignants    0.000219
enfants        0.000191
ecole          0.000189
education      0.000155
non                 NaN
carte               NaN
2                   NaN
college             NaN
scolaire            NaN
Name: ecoles, dtype: float32

lycee


lycee          0.001634
college        0.000663
eleves         0.000227
enfants        0.000141
ecole          0.000137
non                 NaN
carte               NaN
2                   NaN
enseignants         NaN
scolaire            NaN
Name: lycee, dtype: float32

faut


faut           0.001845
faire          0.000365
tout           0.000359
eleves         0.000275
enseignants    0.000231
ecole          0.000218
enfants        0.000207
education      0.000199
enfant         0.000185
non                 NaN
Name: faut, dtype: float32

tout


tout         0.001869
faut         0.000359
faire        0.000327
eleves       0.000247
nationale    0.000220
education    0.000206
enfant       0.000199
ecole        0.000195
enfants      0.000188
non               NaN
Name: tout, dtype: float32

difficulte


difficulte     0.001887
enfants        0.000155
ecole          0.000122
non                 NaN
carte               NaN
2                   NaN
enseignants         NaN
college             NaN
scolaire            NaN
classes             NaN
Name: difficulte, dtype: float32

classe


classe         0.001938
eleves         0.000538
classes        0.000433
faire          0.000305
enseignants    0.000254
enfant         0.000221
enfants        0.000213
education      0.000208
ecole          0.000206
non                 NaN
Name: classe, dtype: float32

enseignement


enseignement    0.001949
qualite         0.000711
prive           0.000343
enseignants     0.000292
education       0.000186
enfants         0.000172
ecole           0.000133
non                  NaN
carte                NaN
2                    NaN
Name: enseignement, dtype: float32

In [125]:
gc.collect()

285

# Question 23: Si vous avez été amené à chercher un emploi, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [126]:
question_23 = "Si vous avez été amené à chercher un emploi, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_23,df_qu_23_one_hot,df_cov_23,df_confidence_23,df_lift_23 = compute_similarities(question_23, new_res)

In [127]:
for i in df_qu_23_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_23[i].sort_values(ascending=False).head(10))

emploi


emploi       5314
pole         4601
recherche     750
travail       643
aide          580
formation     547
trouver       535
faire         521
jamais        487
chomage       431
Name: emploi, dtype: uint16

pole


pole         4684
emploi       4601
recherche     590
travail       586
aide          511
formation     484
faire         458
trouver       442
jamais        409
chomage       384
Name: pole, dtype: uint16

non


non            954
emploi         320
pole           281
concerne       277
entreprises      0
entreprise       0
agents           0
trouve           0
suivi            0
competences      0
Name: non, dtype: uint16

travail


travail      831
emploi       643
pole         586
trouver      198
trouve       154
faire        145
jamais       127
aide         122
recherche    115
chomage      111
Name: travail, dtype: uint16

recherche


recherche    807
emploi       750
pole         590
aide         165
travail      115
formation    105
demande        0
aucun          0
agents         0
trouve         0
Name: recherche, dtype: uint16

aide


aide         695
emploi       580
pole         511
recherche    165
travail      122
trouver      108
demande        0
agents         0
trouve         0
suivi          0
Name: aide, dtype: uint16

formation


formation    683
emploi       547
pole         484
faire        118
travail      109
recherche    105
demande        0
agents         0
trouve         0
suivi          0
Name: formation, dtype: uint16

faire


faire        632
emploi       521
pole         458
travail      145
formation    118
demande        0
aucun          0
agents         0
trouve         0
suivi          0
Name: faire, dtype: uint16

trouver


trouver    614
emploi     535
pole       442
travail    198
aide       108
jamais     101
demande      0
aucun        0
agents       0
trouve       0
Name: trouver, dtype: uint16

concerne


concerne       599
non            277
entreprises      0
entreprise       0
pole             0
emploi           0
agents           0
trouve           0
suivi            0
competences      0
Name: concerne, dtype: uint16

jamais


jamais     595
emploi     487
pole       409
trouve     137
travail    127
trouver    101
demande      0
aucun        0
agents       0
suivi        0
Name: jamais, dtype: uint16

chomage


chomage        585
emploi         431
pole           384
ans            142
mois           122
travail        111
demande          0
competences      0
agents           0
trouve           0
Name: chomage, dtype: uint16

ans


ans           567
emploi        405
pole          334
chomage       142
travail       104
aucun           0
entreprise      0
agents          0
trouve          0
suivi           0
Name: ans, dtype: uint16

tout


tout              530
emploi            417
pole              358
travail           109
offres              0
chomage             0
poste               0
service             0
emplois             0
accompagnement      0
Name: tout, dtype: uint16

trouve


trouve         500
emploi         409
pole           358
travail        154
jamais         137
aucun            0
entreprise       0
agents           0
suivi            0
competences      0
Name: trouve, dtype: uint16

emplois


emplois        463
pole           319
emploi         308
demande          0
aucun            0
entreprise       0
agents           0
trouve           0
suivi            0
competences      0
Name: emplois, dtype: uint16

faut


faut           445
emploi         364
pole           309
demande          0
entreprises      0
entreprise       0
agents           0
trouve           0
suivi            0
competences      0
Name: faut, dtype: uint16

offres


offres         441
emploi         378
pole           341
demande          0
aucun            0
entreprise       0
agents           0
trouve           0
suivi            0
competences      0
Name: offres, dtype: uint16

anpe


anpe           420
emploi         190
entreprises      0
entreprise       0
pole             0
agents           0
trouve           0
suivi            0
competences      0
aucun            0
Name: anpe, dtype: uint16

temps


temps          395
emploi         320
pole           278
demande          0
entreprises      0
entreprise       0
agents           0
trouve           0
suivi            0
competences      0
Name: temps, dtype: uint16

In [128]:
for i in df_qu_23_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_23[i].sort_values(ascending=False).head(10))

emploi


emploi         1.000000
pole           0.982280
demandeurs     0.959854
recherche      0.929368
site           0.914062
conseiller     0.889680
propose        0.881657
trouver        0.871336
conseillers    0.868966
aider          0.868421
Name: emploi, dtype: float32

pole


pole           1.000000
site           0.871094
emploi         0.865826
agents         0.839117
conseiller     0.829181
demandeurs     0.828467
conseillers    0.824138
propose        0.810651
aider          0.785714
chomeurs       0.782759
Name: pole, dtype: float32

non


non            1.000000
concerne       0.462437
emploi         0.060218
pole           0.059991
entreprises    0.000000
entreprise     0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
Name: non, dtype: float32

travail


travail      1.000000
trouver      0.322476
trouve       0.308000
faire        0.229430
jamais       0.213445
tout         0.205660
chomage      0.189744
ans          0.183422
aide         0.175540
formation    0.159590
Name: travail, dtype: float32

recherche


recherche    1.000000
aide         0.237410
formation    0.153734
emploi       0.141137
travail      0.138387
pole         0.125961
demande      0.000000
aucun        0.000000
agents       0.000000
trouve       0.000000
Name: recherche, dtype: float32

aide


aide         1.000000
recherche    0.204461
trouver      0.175896
travail      0.146811
emploi       0.109146
pole         0.109095
demande      0.000000
agents       0.000000
trouve       0.000000
suivi        0.000000
Name: aide, dtype: float32

formation


formation    1.000000
faire        0.186709
travail      0.131167
recherche    0.130112
pole         0.103330
emploi       0.102936
demande      0.000000
agents       0.000000
trouve       0.000000
suivi        0.000000
Name: formation, dtype: float32

faire


faire        1.000000
travail      0.174489
formation    0.172767
emploi       0.098043
pole         0.097780
demande      0.000000
aucun        0.000000
agents       0.000000
trouve       0.000000
suivi        0.000000
Name: faire, dtype: float32

trouver


trouver    1.000000
travail    0.238267
jamais     0.169748
aide       0.155396
emploi     0.100677
pole       0.094364
demande    0.000000
aucun      0.000000
agents     0.000000
trouve     0.000000
Name: trouver, dtype: float32

concerne


concerne       1.000000
non            0.290356
entreprises    0.000000
entreprise     0.000000
pole           0.000000
emploi         0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
Name: concerne, dtype: float32

jamais


jamais     1.000000
trouve     0.274000
trouver    0.164495
travail    0.152828
emploi     0.091645
pole       0.087319
demande    0.000000
aucun      0.000000
agents     0.000000
suivi      0.000000
Name: jamais, dtype: float32

chomage


chomage        1.000000
mois           0.329730
ans            0.250441
travail        0.133574
pole           0.081981
emploi         0.081107
demande        0.000000
competences    0.000000
agents         0.000000
trouve         0.000000
Name: chomage, dtype: float32

ans


ans           1.000000
chomage       0.242735
travail       0.125150
emploi        0.076214
pole          0.071307
aucun         0.000000
entreprise    0.000000
agents        0.000000
trouve        0.000000
suivi         0.000000
Name: ans, dtype: float32

tout


tout          1.000000
travail       0.131167
emploi        0.078472
pole          0.076430
demandeurs    0.000000
conseiller    0.000000
entreprise    0.000000
agents        0.000000
trouve        0.000000
suivi         0.000000
Name: tout, dtype: float32

trouve


trouve         1.000000
jamais         0.230252
travail        0.185319
emploi         0.076967
pole           0.076430
aucun          0.000000
entreprise     0.000000
agents         0.000000
suivi          0.000000
competences    0.000000
Name: trouve, dtype: float32

emplois


emplois        1.000000
pole           0.068104
emploi         0.057960
demande        0.000000
aucun          0.000000
entreprise     0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
Name: emplois, dtype: float32

faut


faut           1.000000
emploi         0.068498
pole           0.065969
demande        0.000000
entreprises    0.000000
entreprise     0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
Name: faut, dtype: float32

offres


offres         1.000000
pole           0.072801
emploi         0.071133
demande        0.000000
aucun          0.000000
entreprise     0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
Name: offres, dtype: float32

anpe


anpe           1.000000
emploi         0.035755
entreprises    0.000000
entreprise     0.000000
pole           0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
aucun          0.000000
Name: anpe, dtype: float32

temps


temps          1.000000
emploi         0.060218
pole           0.059351
demande        0.000000
entreprises    0.000000
entreprise     0.000000
agents         0.000000
trouve         0.000000
suivi          0.000000
competences    0.000000
Name: temps, dtype: float32

In [129]:
for i in df_qu_23_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_23[i].sort_values(ascending=False).head(10))

emploi


emploi         0.000188
pole           0.000185
demandeurs     0.000181
recherche      0.000175
site           0.000172
conseiller     0.000167
propose        0.000166
trouver        0.000164
conseillers    0.000164
aider          0.000163
Name: emploi, dtype: float32

pole


pole           0.000213
site           0.000186
emploi         0.000185
agents         0.000179
conseiller     0.000177
demandeurs     0.000177
conseillers    0.000176
propose        0.000173
aider          0.000168
chomeurs       0.000167
Name: pole, dtype: float32

non


non           0.001048
concerne      0.000485
emploi        0.000063
pole          0.000063
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
poste              NaN
service            NaN
Name: non, dtype: float32

travail


travail      0.001203
trouver      0.000388
trouve       0.000371
faire        0.000276
jamais       0.000257
tout         0.000247
chomage      0.000228
ans          0.000221
aide         0.000211
formation    0.000192
Name: travail, dtype: float32

recherche


recherche     0.001239
aide          0.000294
formation     0.000191
emploi        0.000175
travail       0.000171
pole          0.000156
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
Name: recherche, dtype: float32

aide


aide          0.001439
recherche     0.000294
trouver       0.000253
travail       0.000211
emploi        0.000157
pole          0.000157
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
Name: aide, dtype: float32

formation


formation     0.001464
faire         0.000273
travail       0.000192
recherche     0.000191
pole          0.000151
emploi        0.000151
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
Name: formation, dtype: float32

faire


faire         0.001582
travail       0.000276
formation     0.000273
emploi        0.000155
pole          0.000155
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
Name: faire, dtype: float32

trouver


trouver       0.001629
travail       0.000388
jamais        0.000276
aide          0.000253
emploi        0.000164
pole          0.000154
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
Name: trouver, dtype: float32

concerne


concerne          0.001669
non               0.000485
demandeurs             NaN
conseiller             NaN
offres                 NaN
chomage                NaN
poste                  NaN
service                NaN
emplois                NaN
accompagnement         NaN
Name: concerne, dtype: float32

jamais


jamais        0.001681
trouve        0.000461
trouver       0.000276
travail       0.000257
emploi        0.000154
pole          0.000147
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
Name: jamais, dtype: float32

chomage


chomage       0.001709
mois          0.000564
ans           0.000428
travail       0.000228
pole          0.000140
emploi        0.000139
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
Name: chomage, dtype: float32

ans


ans           0.001764
chomage       0.000428
travail       0.000221
emploi        0.000134
pole          0.000126
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
poste              NaN
Name: ans, dtype: float32

tout


tout          0.001887
travail       0.000247
emploi        0.000148
pole          0.000144
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
poste              NaN
Name: tout, dtype: float32

trouve


trouve        0.002000
jamais        0.000461
travail       0.000371
emploi        0.000154
pole          0.000153
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
Name: trouve, dtype: float32

emplois


emplois       0.002160
pole          0.000147
emploi        0.000125
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
poste              NaN
service            NaN
Name: emplois, dtype: float32

faut


faut          0.002247
emploi        0.000154
pole          0.000148
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
poste              NaN
service            NaN
Name: faut, dtype: float32

offres


offres        0.002268
pole          0.000165
emploi        0.000161
non                NaN
demandeurs         NaN
conseiller         NaN
chomage            NaN
poste              NaN
service            NaN
emplois            NaN
Name: offres, dtype: float32

anpe


anpe          0.002381
emploi        0.000085
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
poste              NaN
service            NaN
emplois            NaN
Name: anpe, dtype: float32

temps


temps         0.002532
emploi        0.000152
pole          0.000150
non                NaN
demandeurs         NaN
conseiller         NaN
offres             NaN
chomage            NaN
poste              NaN
service            NaN
Name: temps, dtype: float32

In [130]:
gc.collect()

294

# Question 24:  Si vous avez été amené à préparer votre retraite, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [131]:
question_24 = "Si vous avez été amené à préparer votre retraite, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_24,df_qu_24_one_hot,df_cov_24,df_confidence_24,df_lift_24 = compute_similarities(question_24, new_res)

In [132]:
for i in df_qu_24_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_24[i].sort_values(ascending=False).head(10))

retraite


retraite    3799
dossier      705
ans          579
mois         494
demande      423
tout         395
carsat       377
faire        376
carriere     351
caisses      332
Name: retraite, dtype: uint16

dossier


dossier     1335
retraite     705
mois         270
carsat       255
demande      205
faire        154
tout         153
internet     149
ans          149
cnav         148
Name: dossier, dtype: uint16

carsat


carsat            1013
retraite           377
dossier            255
mois               138
demande            118
compte               0
arrco                0
information          0
complementaire       0
informations         0
Name: carsat, dtype: uint16

ans


ans           935
retraite      579
carriere      158
dossier       149
faire         143
tout          132
mois          115
demande       101
2               0
impossible      0
Name: ans, dtype: uint16

tout


tout        904
retraite    395
dossier     153
internet    132
ans         132
faire       104
long          0
agirc         0
travail       0
6             0
Name: tout, dtype: uint16

carriere


carriere        778
retraite        351
ans             158
dossier         114
demande           0
aucun             0
informations      0
tout              0
agirc             0
travail           0
Name: carriere, dtype: uint16

mois


mois          725
retraite      494
dossier       270
6             247
demande       162
carsat        138
ans           115
reponse       105
depart        104
trimestres      0
Name: mois, dtype: uint16

non


non             706
retraite        196
concerne        146
long              0
informations      0
tout              0
agirc             0
travail           0
6                 0
retraites         0
Name: non, dtype: uint16

probleme


probleme        697
aucun           314
retraite        255
demande           0
dossiers          0
informations      0
tout              0
agirc             0
travail           0
6                 0
Name: probleme, dtype: uint16

demande


demande      680
retraite     423
dossier      205
mois         162
carsat       118
internet     109
documents    104
faire        103
ans          101
annees         0
Name: demande, dtype: uint16

internet


internet    679
retraite    265
site        157
dossier     149
tout        132
demande     109
long          0
agirc         0
travail       0
6             0
Name: internet, dtype: uint16

faire


faire        664
retraite     376
dossier      154
ans          143
tout         104
demande      103
agirc          0
travail        0
6              0
retraites      0
Name: faire, dtype: uint16

cnav


cnav            653
retraite        241
dossier         148
agirc           119
demande           0
dossiers          0
informations      0
tout              0
travail           0
6                 0
Name: cnav, dtype: uint16

retraites


retraites          647
retraite           277
complementaires    137
caisses            104
demande              0
aucun                0
informations         0
tout                 0
agirc                0
travail              0
Name: retraites, dtype: uint16

caisses


caisses            571
retraite           332
complementaires    146
dossier            118
retraites          104
demande              0
aucun                0
tout                 0
agirc                0
travail              0
Name: caisses, dtype: uint16

difficulte


difficulte      565
retraite        198
demande           0
long              0
informations      0
tout              0
agirc             0
travail           0
6                 0
retraites         0
Name: difficulte, dtype: uint16

aucun


aucun           544
probleme        314
retraite        218
demande           0
dossiers          0
informations      0
tout              0
agirc             0
travail           0
6                 0
Name: aucun, dtype: uint16

site


site            513
retraite        227
internet        157
demande           0
long              0
informations      0
tout              0
agirc             0
travail           0
6                 0
Name: site, dtype: uint16

services


services        495
retraite        227
mois              0
information       0
informations      0
tout              0
agirc             0
travail           0
6                 0
retraites         0
Name: services, dtype: uint16

service


service         493
retraite        211
demande           0
aucun             0
information       0
informations      0
tout              0
agirc             0
travail           0
6                 0
Name: service, dtype: uint16

In [133]:
for i in df_qu_24_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_24[i].sort_values(ascending=False).head(10))

retraite


retraite          1.000000
preparer          0.869048
complementaire    0.824427
depart            0.819121
montant           0.791667
caisse            0.757979
mois              0.681379
6                 0.675000
2                 0.649805
prendre           0.644269
Name: retraite, dtype: float32

dossier


dossier      1.000000
mois         0.372414
6            0.371429
demande      0.301471
documents    0.296569
temps        0.269880
carsat       0.251728
agirc        0.239080
faire        0.231928
cnav         0.226646
Name: dossier, dtype: float32

carsat


carsat            1.000000
dossier           0.191011
mois              0.190345
demande           0.173529
retraite          0.099237
obtenir           0.000000
prendre           0.000000
information       0.000000
complementaire    0.000000
informations      0.000000
Name: carsat, dtype: float32

ans


ans         1.000000
faire       0.215361
carriere    0.203085
mois        0.158621
retraite    0.152409
demande     0.148529
tout        0.146018
dossier     0.111610
arrco       0.000000
annees      0.000000
Name: ans, dtype: float32

tout


tout        1.000000
internet    0.194404
faire       0.156627
ans         0.141176
dossier     0.114607
retraite    0.103975
long        0.000000
agirc       0.000000
travail     0.000000
6           0.000000
Name: tout, dtype: float32

carriere


carriere        1.000000
ans             0.168984
retraite        0.092393
dossier         0.085393
demande         0.000000
aucun           0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
Name: carriere, dtype: float32

mois


mois          1.000000
6             0.882143
depart        0.268734
reponse       0.250000
demande       0.238235
dossier       0.202247
carsat        0.136229
retraite      0.130034
ans           0.122995
trimestres    0.000000
Name: mois, dtype: float32

non


non             1.000000
concerne        0.408964
retraite        0.051593
long            0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
retraites       0.000000
Name: non, dtype: float32

probleme


probleme        1.000000
aucun           0.577206
retraite        0.067123
demande         0.000000
dossiers        0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
Name: probleme, dtype: float32

demande


demande      1.000000
documents    0.254902
mois         0.223448
internet     0.160530
faire        0.155120
dossier      0.153558
carsat       0.116486
retraite     0.111345
ans          0.108021
obtenir      0.000000
Name: demande, dtype: float32

internet


internet    1.000000
site        0.306043
demande     0.160294
tout        0.146018
dossier     0.111610
retraite    0.069755
long        0.000000
agirc       0.000000
travail     0.000000
6           0.000000
Name: internet, dtype: float32

faire


faire        1.000000
ans          0.152941
demande      0.151471
dossier      0.115356
tout         0.115044
retraite     0.098973
agirc        0.000000
travail      0.000000
6            0.000000
retraites    0.000000
Name: faire, dtype: float32

cnav


cnav            1.000000
agirc           0.273563
dossier         0.110861
retraite        0.063438
demande         0.000000
dossiers        0.000000
informations    0.000000
tout            0.000000
travail         0.000000
6               0.000000
Name: cnav, dtype: float32

retraites


retraites          1.000000
complementaires    0.359580
caisses            0.182137
retraite           0.072914
demande            0.000000
aucun              0.000000
informations       0.000000
tout               0.000000
agirc              0.000000
travail            0.000000
Name: retraites, dtype: float32

caisses


caisses            1.000000
complementaires    0.383202
retraites          0.160742
dossier            0.088390
retraite           0.087391
demande            0.000000
aucun              0.000000
tout               0.000000
agirc              0.000000
travail            0.000000
Name: caisses, dtype: float32

difficulte


difficulte      1.000000
retraite        0.052119
demande         0.000000
long            0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
retraites       0.000000
Name: difficulte, dtype: float32

aucun


aucun           1.000000
probleme        0.450502
retraite        0.057384
demande         0.000000
dossiers        0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
Name: aucun, dtype: float32

site


site            1.000000
internet        0.231222
retraite        0.059753
demande         0.000000
long            0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
Name: site, dtype: float32

services


services        1.000000
retraite        0.059753
mois            0.000000
information     0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
retraites       0.000000
Name: services, dtype: float32

service


service         1.000000
retraite        0.055541
demande         0.000000
aucun           0.000000
information     0.000000
informations    0.000000
tout            0.000000
agirc           0.000000
travail         0.000000
6               0.000000
Name: service, dtype: float32

In [134]:
for i in df_qu_24_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_24[i].sort_values(ascending=False).head(10))

retraite


retraite          0.000263
preparer          0.000229
complementaire    0.000217
depart            0.000216
montant           0.000208
caisse            0.000200
mois              0.000179
6                 0.000178
2                 0.000171
prendre           0.000170
Name: retraite, dtype: float32

dossier


dossier      0.000749
mois         0.000279
6            0.000278
demande      0.000226
documents    0.000222
temps        0.000202
carsat       0.000189
agirc        0.000179
faire        0.000174
cnav         0.000170
Name: dossier, dtype: float32

carsat


carsat            0.000987
dossier           0.000189
mois              0.000188
demande           0.000171
retraite          0.000098
non                    NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
Name: carsat, dtype: float32

ans


ans         0.001070
faire       0.000230
carriere    0.000217
mois        0.000170
retraite    0.000163
demande     0.000159
tout        0.000156
dossier     0.000119
non              NaN
carsat           NaN
Name: ans, dtype: float32

tout


tout              0.001106
internet          0.000215
faire             0.000173
ans               0.000156
dossier           0.000127
retraite          0.000115
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
Name: tout, dtype: float32

carriere


carriere          0.001285
ans               0.000217
retraite          0.000119
dossier           0.000110
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
Name: carriere, dtype: float32

mois


mois        0.001379
6           0.001217
depart      0.000371
reponse     0.000345
demande     0.000329
dossier     0.000279
carsat      0.000188
retraite    0.000179
ans         0.000170
non              NaN
Name: mois, dtype: float32

non


non               0.001416
concerne          0.000579
retraite          0.000073
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
2                      NaN
Name: non, dtype: float32

probleme


probleme          0.001435
aucun             0.000828
retraite          0.000096
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
Name: probleme, dtype: float32

demande


demande      0.001471
documents    0.000375
mois         0.000329
internet     0.000236
faire        0.000228
dossier      0.000226
carsat       0.000171
retraite     0.000164
ans          0.000159
non               NaN
Name: demande, dtype: float32

internet


internet          0.001473
site              0.000451
demande           0.000236
tout              0.000215
dossier           0.000164
retraite          0.000103
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
Name: internet, dtype: float32

faire


faire             0.001506
ans               0.000230
demande           0.000228
dossier           0.000174
tout              0.000173
retraite          0.000149
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
Name: faire, dtype: float32

cnav


cnav              0.001531
agirc             0.000419
dossier           0.000170
retraite          0.000097
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
Name: cnav, dtype: float32

retraites


retraites          0.001546
complementaires    0.000556
caisses            0.000282
retraite           0.000113
non                     NaN
carsat                  NaN
complementaire          NaN
obtenir                 NaN
compte                  NaN
arrco                   NaN
Name: retraites, dtype: float32

caisses


caisses            0.001751
complementaires    0.000671
retraites          0.000282
dossier            0.000155
retraite           0.000153
non                     NaN
carsat                  NaN
complementaire          NaN
obtenir                 NaN
compte                  NaN
Name: caisses, dtype: float32

difficulte


difficulte        0.001770
retraite          0.000092
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
2                      NaN
Name: difficulte, dtype: float32

aucun


aucun             0.001838
probleme          0.000828
retraite          0.000105
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
Name: aucun, dtype: float32

site


site              0.001949
internet          0.000451
retraite          0.000116
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
Name: site, dtype: float32

services


services          0.002020
retraite          0.000121
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
2                      NaN
Name: services, dtype: float32

service


service           0.002028
retraite          0.000113
non                    NaN
carsat                 NaN
complementaire         NaN
obtenir                NaN
compte                 NaN
arrco                  NaN
annees                 NaN
2                      NaN
Name: service, dtype: float32

In [135]:
gc.collect()

294

# Question 25:  Si vous avez été amené à demander un remboursement de soins de santé, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [136]:
question_25 = "Si vous avez été amené à demander un remboursement de soins de santé, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_25,df_qu_25_one_hot,df_cov_25,df_confidence_25,df_lift_25 = compute_similarities(question_25, new_res)

In [137]:
for i in df_qu_25_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_25[i].sort_values(ascending=False).head(10))

remboursement


remboursement    1647
soins             398
securite          293
sociale           289
mutuelle          265
sante             250
cpam              204
carte             164
mutuelles         157
charge            149
Name: remboursement, dtype: uint16

securite


securite          1494
sociale           1432
mutuelle           324
remboursement      293
soins              219
remboursements     208
mutuelles          181
sante              171
charge             158
probleme           138
Name: securite, dtype: uint16

sociale


sociale           1490
securite          1432
mutuelle           327
remboursement      289
soins              224
remboursements     215
mutuelles          182
sante              171
charge             159
faire              137
Name: sociale, dtype: uint16

mutuelle


mutuelle          1332
sociale            327
securite           324
remboursement      265
remboursements     192
soins              183
sante              171
cpam               171
probleme           155
tout               155
Name: mutuelle, dtype: uint16

soins


soins             1257
remboursement      398
sante              301
remboursements     229
sociale            224
charge             224
securite           219
dentaires          210
mutuelle           183
mutuelles          145
Name: soins, dtype: uint16

cpam


cpam              1252
remboursement      204
mutuelle           171
soins              145
remboursements     144
mois               129
probleme           118
faire              111
tout               106
mutuelles          102
Name: cpam, dtype: uint16

probleme


probleme          1147
aucun              351
mutuelle           155
remboursement      141
securite           138
sociale            136
cpam               118
remboursements     109
secu                 0
efficace             0
Name: probleme, dtype: uint16

remboursements


remboursements    1123
soins              229
sociale            215
securite           208
sante              196
mutuelle           192
cpam               144
mutuelles          139
carte              123
probleme           109
Name: remboursements, dtype: uint16

sante


sante             1103
soins              301
remboursement      250
remboursements     196
securite           171
mutuelle           171
sociale            171
systeme            166
mutuelles          146
charge             139
Name: sante, dtype: uint16

carte


carte             927
vitale            822
remboursement     164
sante             129
mutuelle          123
remboursements    123
soins             120
securite          107
sociale           106
cpam                0
Name: carte, dtype: uint16

tout


tout             841
mutuelle         155
remboursement    130
sante            126
sociale          124
securite         122
faire            109
soins            109
cpam             106
rembourser         0
Name: tout, dtype: uint16

vitale


vitale            830
carte             822
remboursement     147
mutuelle          116
sante             113
soins             112
remboursements    105
efficace            0
tiers               0
rembourse           0
Name: vitale, dtype: uint16

mutuelles


mutuelles         825
sociale           182
securite          181
remboursement     157
sante             146
soins             145
remboursements    139
charge            116
mutuelle          114
cpam              102
Name: mutuelles, dtype: uint16

charge


charge           795
prise            401
soins            224
sociale          159
securite         158
remboursement    149
sante            139
mutuelle         138
mutuelles        116
frais            103
Name: charge, dtype: uint16

faire


faire            718
soins            144
securite         138
sociale          137
rembourser       129
remboursement    125
sante            121
mutuelle         120
cpam             111
tout             109
Name: faire, dtype: uint16

non


non              668
remboursement    133
long               0
tout               0
secu               0
efficace           0
tiers              0
rembourse          0
payant             0
charge             0
Name: non, dtype: uint16

fonctionne


fonctionne    631
systeme       103
demande         0
long            0
secu            0
efficace        0
tiers           0
rembourse       0
payant          0
charge          0
Name: fonctionne, dtype: uint16

aucun


aucun        611
probleme     351
demande        0
long           0
secu           0
efficace       0
tiers          0
rembourse      0
payant         0
charge         0
Name: aucun, dtype: uint16

secu


secu             602
mutuelle         154
remboursement    109
demande            0
long               0
tout               0
efficace           0
tiers              0
rembourse          0
payant             0
Name: secu, dtype: uint16

faut


faut         581
soins        115
sociale      115
faire        107
sante        107
securite     107
mutuelle     106
rembourse      0
payant         0
long           0
Name: faut, dtype: uint16

In [138]:
for i in df_qu_25_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_25[i].sort_values(ascending=False).head(10))

remboursement


remboursement    1.000000
rapide           0.437500
delais           0.402256
lunettes         0.360714
dentaires        0.328125
frais            0.327982
soins            0.316627
demande          0.312834
medecin          0.255000
systeme          0.245681
Name: remboursement, dtype: float32

securite


securite          1.000000
sociale           0.961074
mutuelle          0.243243
mutuelles         0.219394
charge            0.198742
mois              0.195298
faire             0.192201
remboursements    0.185218
faut              0.184165
remboursement     0.177899
Name: securite, dtype: float32

sociale


sociale           1.000000
securite          0.958501
mutuelle          0.245495
mutuelles         0.220606
mois              0.206148
charge            0.200000
faut              0.197935
remboursements    0.191451
faire             0.190808
soins             0.178202
Name: sociale, dtype: float32

mutuelle


mutuelle          1.000000
secu              0.255814
sociale           0.219463
securite          0.216867
tout              0.184304
faut              0.182444
charge            0.173585
remboursements    0.170971
faire             0.167131
remboursement     0.160899
Name: mutuelle, dtype: float32

soins


soins             1.000000
dentaires         0.656250
rembourses        0.459649
charge            0.281761
sante             0.272892
prise             0.258947
remboursement     0.241651
remboursements    0.203918
faire             0.200557
faut              0.197935
Name: soins, dtype: float32

cpam


cpam              1.000000
mois              0.233273
faire             0.154596
mutuelle          0.128378
remboursements    0.128228
tout              0.126040
remboursement     0.123862
mutuelles         0.123636
soins             0.115354
probleme          0.102877
Name: cpam, dtype: float32

probleme


probleme          1.000000
aucun             0.574468
mutuelle          0.116366
remboursements    0.097061
cpam              0.094249
securite          0.092369
sociale           0.091275
remboursement     0.085610
secu              0.000000
efficace          0.000000
Name: probleme, dtype: float32

remboursements


remboursements    1.000000
soins             0.182180
sante             0.177697
mutuelles         0.168485
sociale           0.144295
mutuelle          0.144144
securite          0.139224
carte             0.132686
vitale            0.126506
cpam              0.115016
Name: remboursements, dtype: float32

sante


sante             1.000000
systeme           0.318618
frais             0.270642
soins             0.239459
faut              0.184165
mutuelles         0.176970
charge            0.174843
remboursements    0.174533
faire             0.168524
remboursement     0.151791
Name: sante, dtype: float32

carte


carte             1.000000
vitale            0.990361
sante             0.116954
remboursements    0.109528
remboursement     0.099575
soins             0.095465
mutuelle          0.092342
securite          0.071620
sociale           0.071141
cpam              0.000000
Name: carte, dtype: float32

tout


tout             1.000000
faire            0.151811
mutuelle         0.116366
sante            0.114234
soins            0.086714
cpam             0.084665
sociale          0.083221
securite         0.081660
remboursement    0.078931
compte           0.000000
Name: tout, dtype: float32

vitale


vitale            1.000000
carte             0.886731
sante             0.102448
remboursements    0.093500
remboursement     0.089253
soins             0.089101
mutuelle          0.087087
tiers             0.000000
rembourse         0.000000
aucun             0.000000
Name: vitale, dtype: float32

mutuelles


mutuelles         1.000000
charge            0.145912
sante             0.132366
remboursements    0.123776
sociale           0.122148
securite          0.121151
soins             0.115354
remboursement     0.095325
mutuelle          0.085586
cpam              0.081470
Name: mutuelles, dtype: float32

charge


charge       1.000000
prise        0.844211
frais        0.236239
soins        0.178202
faire        0.143454
mutuelles    0.140606
sante        0.126020
sociale      0.106711
securite     0.105756
mutuelle     0.103604
Name: charge, dtype: float32

faire


faire         1.000000
rembourser    0.437288
faut          0.184165
tout          0.129608
charge        0.129560
soins         0.114558
sante         0.109701
securite      0.092369
sociale       0.091946
mutuelle      0.090090
Name: faire, dtype: float32

non


non              1.000000
remboursement    0.080753
long             0.000000
tout             0.000000
secu             0.000000
efficace         0.000000
tiers            0.000000
rembourse        0.000000
payant           0.000000
charge           0.000000
Name: non, dtype: float32

fonctionne


fonctionne    1.000000
systeme       0.197697
demande       0.000000
long          0.000000
secu          0.000000
efficace      0.000000
tiers         0.000000
rembourse     0.000000
payant        0.000000
charge        0.000000
Name: fonctionne, dtype: float32

aucun


aucun        1.000000
probleme     0.306016
demande      0.000000
long         0.000000
secu         0.000000
efficace     0.000000
tiers        0.000000
rembourse    0.000000
payant       0.000000
charge       0.000000
Name: aucun, dtype: float32

secu


secu             1.000000
mutuelle         0.115616
remboursement    0.066181
demande          0.000000
long             0.000000
tout             0.000000
efficace         0.000000
tiers            0.000000
rembourse        0.000000
payant           0.000000
Name: secu, dtype: float32

faut


faut         1.000000
faire        0.149025
sante        0.097008
soins        0.091488
mutuelle     0.079580
sociale      0.077181
securite     0.071620
efficace     0.000000
tiers        0.000000
rembourse    0.000000
Name: faut, dtype: float32

In [139]:
for i in df_qu_25_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_25[i].sort_values(ascending=False).head(10))

remboursement


remboursement    0.000607
rapide           0.000266
delais           0.000244
lunettes         0.000219
dentaires        0.000199
frais            0.000199
soins            0.000192
demande          0.000190
medecin          0.000155
systeme          0.000149
Name: remboursement, dtype: float32

securite


securite          0.000669
sociale           0.000643
mutuelle          0.000163
mutuelles         0.000147
charge            0.000133
mois              0.000131
faire             0.000129
remboursements    0.000124
faut              0.000123
remboursement     0.000119
Name: securite, dtype: float32

sociale


sociale           0.000671
securite          0.000643
mutuelle          0.000165
mutuelles         0.000148
mois              0.000138
charge            0.000134
faut              0.000133
remboursements    0.000128
faire             0.000128
soins             0.000120
Name: sociale, dtype: float32

mutuelle


mutuelle          0.000751
secu              0.000192
sociale           0.000165
securite          0.000163
tout              0.000138
faut              0.000137
charge            0.000130
remboursements    0.000128
faire             0.000125
remboursement     0.000121
Name: mutuelle, dtype: float32

soins


soins             0.000796
dentaires         0.000522
rembourses        0.000366
charge            0.000224
sante             0.000217
prise             0.000206
remboursement     0.000192
remboursements    0.000162
faire             0.000160
faut              0.000157
Name: soins, dtype: float32

cpam


cpam              0.000799
mois              0.000186
faire             0.000123
mutuelle          0.000103
remboursements    0.000102
tout              0.000101
remboursement     0.000099
mutuelles         0.000099
soins             0.000092
probleme          0.000082
Name: cpam, dtype: float32

probleme


probleme          0.000872
aucun             0.000501
mutuelle          0.000101
remboursements    0.000085
cpam              0.000082
securite          0.000081
sociale           0.000080
remboursement     0.000075
non                    NaN
fonctionne             NaN
Name: probleme, dtype: float32

remboursements


remboursements    0.000890
soins             0.000162
sante             0.000158
mutuelles         0.000150
sociale           0.000128
mutuelle          0.000128
securite          0.000124
carte             0.000118
vitale            0.000113
cpam              0.000102
Name: remboursements, dtype: float32

sante


sante             0.000907
systeme           0.000289
frais             0.000245
soins             0.000217
faut              0.000167
mutuelles         0.000160
charge            0.000159
remboursements    0.000158
faire             0.000153
remboursement     0.000138
Name: sante, dtype: float32

carte


carte             0.001079
vitale            0.001068
sante             0.000126
remboursements    0.000118
remboursement     0.000107
soins             0.000103
mutuelle          0.000100
securite          0.000077
sociale           0.000077
non                    NaN
Name: carte, dtype: float32

tout


tout             0.001189
faire            0.000181
mutuelle         0.000138
sante            0.000136
soins            0.000103
cpam             0.000101
sociale          0.000099
securite         0.000097
remboursement    0.000094
non                   NaN
Name: tout, dtype: float32

vitale


vitale            0.001205
carte             0.001068
sante             0.000123
remboursements    0.000113
remboursement     0.000108
soins             0.000107
mutuelle          0.000105
non                    NaN
securite               NaN
fonctionne             NaN
Name: vitale, dtype: float32

mutuelles


mutuelles         0.001212
charge            0.000177
sante             0.000160
remboursements    0.000150
sociale           0.000148
securite          0.000147
soins             0.000140
remboursement     0.000116
mutuelle          0.000104
cpam              0.000099
Name: mutuelles, dtype: float32

charge


charge       0.001258
prise        0.001062
frais        0.000297
soins        0.000224
faire        0.000180
mutuelles    0.000177
sante        0.000159
sociale      0.000134
securite     0.000133
mutuelle     0.000130
Name: charge, dtype: float32

faire


faire         0.001393
rembourser    0.000609
faut          0.000256
tout          0.000181
charge        0.000180
soins         0.000160
sante         0.000153
securite      0.000129
sociale       0.000128
mutuelle      0.000125
Name: faire, dtype: float32

non


non               0.001497
remboursement     0.000121
securite               NaN
fonctionne             NaN
remboursements         NaN
compte                 NaN
carte                  NaN
payer                  NaN
rembourser             NaN
dentaires              NaN
Name: non, dtype: float32

fonctionne


fonctionne        0.001585
systeme           0.000313
non                    NaN
securite               NaN
remboursements         NaN
compte                 NaN
carte                  NaN
payer                  NaN
rembourser             NaN
dentaires              NaN
Name: fonctionne, dtype: float32

aucun


aucun             0.001637
probleme          0.000501
non                    NaN
securite               NaN
fonctionne             NaN
remboursements         NaN
compte                 NaN
carte                  NaN
payer                  NaN
rembourser             NaN
Name: aucun, dtype: float32

secu


secu              0.001661
mutuelle          0.000192
remboursement     0.000110
non                    NaN
securite               NaN
fonctionne             NaN
remboursements         NaN
compte                 NaN
carte                  NaN
payer                  NaN
Name: secu, dtype: float32

faut


faut              0.001721
faire             0.000256
sante             0.000167
soins             0.000157
mutuelle          0.000137
sociale           0.000133
securite          0.000123
non                    NaN
fonctionne             NaN
remboursements         NaN
Name: faut, dtype: float32

In [140]:
gc.collect()

285

# Question 26:  Si vous avez été amené à faire une demande d'aide pour une situation de handicap, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [141]:
question_26 = "Si vous avez été amené à faire une demande d'aide pour une situation de handicap, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_26,df_qu_26_one_hot,df_cov_26,df_confidence_26,df_lift_26 = compute_similarities(question_26, new_res)

In [142]:
for i in df_qu_26_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_26[i].sort_values(ascending=False).head(10))

non


non          1008
concerne      392
mois            0
reponse         0
long            0
handicap        0
handicape       0
tout            0
dossiers        0
demande         0
Name: non, dtype: uint16

mdph


mdph        980
dossier     285
handicap    213
demande     182
mois        174
dossiers    157
ans         130
faire       129
aide        123
long        121
Name: mdph, dtype: uint16

concerne


concerne     773
non          392
mois           0
reponse        0
long           0
handicap       0
handicape      0
tout           0
dossiers       0
demande        0
Name: concerne, dtype: uint16

handicap


handicap    695
mdph        213
dossier     154
ans         142
faire       132
aide        126
demande     124
tous        105
concerne      0
faut          0
Name: handicap, dtype: uint16

dossier


dossier     600
mdph        285
handicap    154
demande     151
mois        143
ans         116
tous          0
concerne      0
aide          0
faire         0
Name: dossier, dtype: uint16

demande


demande      538
mdph         182
dossier      151
aide         130
mois         125
handicap     124
faire        102
handicape    102
tous           0
concerne       0
Name: demande, dtype: uint16

aide


aide         434
demande      130
handicap     126
mdph         123
mois           0
reponse        0
long           0
handicape      0
tout           0
dossiers       0
Name: aide, dtype: uint16

mois


mois        405
mdph        174
dossier     143
demande     125
tous          0
concerne      0
aide          0
faire         0
ans           0
faut          0
Name: mois, dtype: uint16

handicape


handicape    379
mdph         111
demande      102
mois           0
reponse        0
long           0
handicap       0
tout           0
dossiers       0
dossier        0
Name: handicape, dtype: uint16

ans


ans          371
tous         148
handicap     142
mdph         130
dossier      116
dossiers       0
reponse        0
long           0
handicape      0
tout           0
Name: ans, dtype: uint16

faire


faire        361
handicap     132
mdph         129
demande      102
mois           0
reponse        0
long           0
handicape      0
tout           0
dossiers       0
Name: faire, dtype: uint16

long


long         296
mdph         121
demande        0
mois           0
reponse        0
handicap       0
handicape      0
tout           0
dossiers       0
dossier        0
Name: long, dtype: uint16

dossiers


dossiers     291
mdph         157
demande        0
mois           0
reponse        0
long           0
handicap       0
handicape      0
tout           0
dossier        0
Name: dossiers, dtype: uint16

tout


tout         272
demande        0
faut           0
reponse        0
long           0
handicap       0
handicape      0
dossiers       0
mois           0
dossier        0
Name: tout, dtype: uint16

reponse


reponse      269
demande        0
faut           0
long           0
handicap       0
handicape      0
tout           0
dossiers       0
mois           0
dossier        0
Name: reponse, dtype: uint16

tous


tous         259
ans          148
handicap     105
mdph         103
demande        0
dossiers       0
reponse        0
long           0
handicape      0
tout           0
Name: tous, dtype: uint16

faut


faut         258
demande        0
reponse        0
long           0
handicap       0
handicape      0
tout           0
dossiers       0
mois           0
dossier        0
Name: faut, dtype: uint16

ras


ras          258
demande        0
mois           0
reponse        0
long           0
handicap       0
handicape      0
tout           0
dossiers       0
dossier        0
Name: ras, dtype: uint16

In [143]:
for i in df_qu_26_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_26[i].sort_values(ascending=False).head(10))

non


non          1.000000
concerne     0.507115
mois         0.000000
reponse      0.000000
long         0.000000
handicap     0.000000
handicape    0.000000
tout         0.000000
dossiers     0.000000
demande      0.000000
Name: non, dtype: float32

mdph


mdph        1.000000
dossiers    0.539519
dossier     0.475000
mois        0.429630
long        0.408784
tous        0.397683
faire       0.357341
ans         0.350404
demande     0.338290
handicap    0.306475
Name: mdph, dtype: float32

concerne


concerne     1.000000
non          0.388889
mois         0.000000
reponse      0.000000
long         0.000000
handicap     0.000000
handicape    0.000000
tout         0.000000
dossiers     0.000000
demande      0.000000
Name: concerne, dtype: float32

handicap


handicap    1.000000
tous        0.405405
ans         0.382749
faire       0.365651
aide        0.290323
dossier     0.256667
demande     0.230483
mdph        0.217347
concerne    0.000000
faut        0.000000
Name: handicap, dtype: float32

dossier


dossier     1.000000
mois        0.353086
ans         0.312668
mdph        0.290816
demande     0.280669
handicap    0.221583
concerne    0.000000
tous        0.000000
faire       0.000000
aide        0.000000
Name: dossier, dtype: float32

demande


demande      1.000000
mois         0.308642
aide         0.299539
faire        0.282548
handicape    0.269129
dossier      0.251667
mdph         0.185714
handicap     0.178417
concerne     0.000000
ans          0.000000
Name: demande, dtype: float32

aide


aide         1.000000
demande      0.241636
handicap     0.181295
mdph         0.125510
mois         0.000000
reponse      0.000000
long         0.000000
handicape    0.000000
tout         0.000000
dossiers     0.000000
Name: aide, dtype: float32

mois


mois        1.000000
dossier     0.238333
demande     0.232342
mdph        0.177551
aide        0.000000
tous        0.000000
concerne    0.000000
faire       0.000000
ans         0.000000
faut        0.000000
Name: mois, dtype: float32

handicape


handicape    1.000000
demande      0.189591
mdph         0.113265
mois         0.000000
reponse      0.000000
long         0.000000
handicap     0.000000
tout         0.000000
dossiers     0.000000
dossier      0.000000
Name: handicape, dtype: float32

ans


ans          1.000000
tous         0.571429
handicap     0.204317
dossier      0.193333
mdph         0.132653
dossiers     0.000000
reponse      0.000000
long         0.000000
handicape    0.000000
tout         0.000000
Name: ans, dtype: float32

faire


faire        1.000000
handicap     0.189928
demande      0.189591
mdph         0.131633
mois         0.000000
reponse      0.000000
long         0.000000
handicape    0.000000
tout         0.000000
dossiers     0.000000
Name: faire, dtype: float32

long


long         1.000000
mdph         0.123469
demande      0.000000
mois         0.000000
reponse      0.000000
handicap     0.000000
handicape    0.000000
tout         0.000000
dossiers     0.000000
dossier      0.000000
Name: long, dtype: float32

dossiers


dossiers     1.000000
mdph         0.160204
demande      0.000000
mois         0.000000
reponse      0.000000
long         0.000000
handicap     0.000000
handicape    0.000000
tout         0.000000
dossier      0.000000
Name: dossiers, dtype: float32

tout


tout         1.0
demande      0.0
faut         0.0
reponse      0.0
long         0.0
handicap     0.0
handicape    0.0
dossiers     0.0
mois         0.0
dossier      0.0
Name: tout, dtype: float32

reponse


reponse      1.0
demande      0.0
faut         0.0
long         0.0
handicap     0.0
handicape    0.0
tout         0.0
dossiers     0.0
mois         0.0
dossier      0.0
Name: reponse, dtype: float32

tous


tous         1.000000
ans          0.398922
handicap     0.151079
mdph         0.105102
demande      0.000000
dossiers     0.000000
reponse      0.000000
long         0.000000
handicape    0.000000
tout         0.000000
Name: tous, dtype: float32

faut


faut         1.0
demande      0.0
reponse      0.0
long         0.0
handicap     0.0
handicape    0.0
tout         0.0
dossiers     0.0
mois         0.0
dossier      0.0
Name: faut, dtype: float32

ras


ras          1.0
demande      0.0
mois         0.0
reponse      0.0
long         0.0
handicap     0.0
handicape    0.0
tout         0.0
dossiers     0.0
dossier      0.0
Name: ras, dtype: float32

In [144]:
for i in df_qu_26_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_26[i].sort_values(ascending=False).head(10))

non


non          0.000992
concerne     0.000503
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
dossiers          NaN
mois              NaN
dossier           NaN
Name: non, dtype: float32

mdph


mdph        0.001020
dossiers    0.000551
dossier     0.000485
mois        0.000438
long        0.000417
tous        0.000406
faire       0.000365
ans         0.000358
demande     0.000345
handicap    0.000313
Name: mdph, dtype: float32

concerne


concerne     0.001294
non          0.000503
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
dossiers          NaN
mois              NaN
dossier           NaN
Name: concerne, dtype: float32

handicap


handicap    0.001439
tous        0.000583
ans         0.000551
faire       0.000526
aide        0.000418
dossier     0.000369
demande     0.000332
mdph        0.000313
non              NaN
reponse          NaN
Name: handicap, dtype: float32

dossier


dossier      0.001667
mois         0.000588
ans          0.000521
mdph         0.000485
demande      0.000468
handicap     0.000369
non               NaN
reponse           NaN
long              NaN
handicape         NaN
Name: dossier, dtype: float32

demande


demande      0.001859
mois         0.000574
aide         0.000557
faire        0.000525
handicape    0.000500
dossier      0.000468
mdph         0.000345
handicap     0.000332
non               NaN
reponse           NaN
Name: demande, dtype: float32

aide


aide         0.002304
demande      0.000557
handicap     0.000418
mdph         0.000289
non               NaN
reponse           NaN
long              NaN
handicape         NaN
tout              NaN
dossiers          NaN
Name: aide, dtype: float32

mois


mois         0.002469
dossier      0.000588
demande      0.000574
mdph         0.000438
non               NaN
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
Name: mois, dtype: float32

handicape


handicape    0.002639
demande      0.000500
mdph         0.000299
non               NaN
reponse           NaN
long              NaN
handicap          NaN
tout              NaN
dossiers          NaN
mois              NaN
Name: handicape, dtype: float32

ans


ans          0.002695
tous         0.001540
handicap     0.000551
dossier      0.000521
mdph         0.000358
non               NaN
reponse           NaN
long              NaN
handicape         NaN
tout              NaN
Name: ans, dtype: float32

faire


faire        0.002770
handicap     0.000526
demande      0.000525
mdph         0.000365
non               NaN
reponse           NaN
long              NaN
handicape         NaN
tout              NaN
dossiers          NaN
Name: faire, dtype: float32

long


long         0.003378
mdph         0.000417
non               NaN
reponse           NaN
handicap          NaN
handicape         NaN
tout              NaN
dossiers          NaN
mois              NaN
dossier           NaN
Name: long, dtype: float32

dossiers


dossiers     0.003436
mdph         0.000551
non               NaN
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
mois              NaN
dossier           NaN
Name: dossiers, dtype: float32

tout


tout         0.003676
non               NaN
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
dossiers          NaN
mois              NaN
dossier           NaN
ans               NaN
Name: tout, dtype: float32

reponse


reponse      0.003717
non               NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
dossiers          NaN
mois              NaN
dossier           NaN
ans               NaN
Name: reponse, dtype: float32

tous


tous         0.003861
ans          0.001540
handicap     0.000583
mdph         0.000406
non               NaN
reponse           NaN
long              NaN
handicape         NaN
tout              NaN
dossiers          NaN
Name: tous, dtype: float32

faut


faut         0.003876
non               NaN
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
dossiers          NaN
mois              NaN
dossier           NaN
Name: faut, dtype: float32

ras


ras          0.003876
non               NaN
reponse           NaN
long              NaN
handicap          NaN
handicape         NaN
tout              NaN
dossiers          NaN
mois              NaN
dossier           NaN
Name: ras, dtype: float32

In [145]:
gc.collect()

133

# Question 27: Si vous avez été amené à créer une entreprise, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [146]:
question_27 = "Si vous avez été amené à créer une entreprise, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_27,df_qu_27_one_hot,df_cov_27,df_confidence_27,df_lift_27 = compute_similarities(question_27, new_res)

In [147]:
for i in df_qu_27_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_27[i].sort_values(ascending=False).head(10))

entreprise


entreprise    1076
creation       401
creer          285
auto           147
urssaf         144
faire          133
tout           120
aide           102
activite         0
impots           0
Name: entreprise, dtype: uint16

non


non            739
concerne       279
entreprise       0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
faut             0
Name: non, dtype: uint16

creation


creation       690
entreprise     401
faut             0
aide             0
impots           0
demarches        0
entreprises      0
activite         0
rsi              0
tout             0
Name: creation, dtype: uint16

urssaf


urssaf         545
entreprise     144
rsi            104
faut             0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
tout             0
Name: urssaf, dtype: uint16

concerne


concerne       502
non            279
entreprise       0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
faut             0
Name: concerne, dtype: uint16

creer


creer          414
entreprise     285
faut             0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
tout             0
Name: creer, dtype: uint16

rsi


rsi            389
urssaf         104
faut             0
entreprise       0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
tout             0
Name: rsi, dtype: uint16

tout


tout           376
entreprise     120
aide             0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
faut             0
Name: tout, dtype: uint16

auto


auto            373
entrepreneur    218
entreprise      147
faut              0
impots            0
creation          0
demarches         0
entreprises       0
activite          0
rsi               0
Name: auto, dtype: uint16

faire


faire          361
entreprise     133
faut             0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
tout             0
Name: faire, dtype: uint16

demarches


demarches      338
faut             0
aide             0
impots           0
creation         0
entreprises      0
activite         0
rsi              0
entreprise       0
tout             0
Name: demarches, dtype: uint16

commerce


commerce       291
faut             0
entreprise       0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
tout             0
Name: commerce, dtype: uint16

entrepreneur


entrepreneur    285
auto            218
faut              0
entreprise        0
impots            0
creation          0
demarches         0
entreprises       0
activite          0
rsi               0
Name: entrepreneur, dtype: uint16

impots


impots         285
faut             0
aide             0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
entreprise       0
tout             0
Name: impots, dtype: uint16

faut


faut           282
aide             0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
entreprise       0
tout             0
Name: faut, dtype: uint16

entreprises


entreprises    278
faut             0
aide             0
impots           0
creation         0
demarches        0
activite         0
rsi              0
entreprise       0
tout             0
Name: entreprises, dtype: uint16

aide


aide           273
entreprise     102
faut             0
impots           0
creation         0
demarches        0
entreprises      0
activite         0
rsi              0
tout             0
Name: aide, dtype: uint16

activite


activite       255
faut             0
aide             0
impots           0
creation         0
demarches        0
entreprises      0
rsi              0
entreprise       0
tout             0
Name: activite, dtype: uint16

In [148]:
for i in df_qu_27_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_27[i].sort_values(ascending=False).head(10))

entreprise


entreprise    1.000000
creer         0.688406
creation      0.581159
auto          0.394102
aide          0.373626
faire         0.368421
tout          0.319149
urssaf        0.264220
activite      0.000000
impots        0.000000
Name: entreprise, dtype: float32

non


non            1.000000
concerne       0.555777
entreprise     0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
rsi            0.000000
faut           0.000000
Name: non, dtype: float32

creation


creation       1.000000
entreprise     0.372677
faut           0.000000
aide           0.000000
impots         0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
rsi            0.000000
tout           0.000000
Name: creation, dtype: float32

urssaf


urssaf         1.000000
rsi            0.267352
entreprise     0.133829
faut           0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
tout           0.000000
Name: urssaf, dtype: float32

concerne


concerne       1.000000
non            0.377537
entreprise     0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
rsi            0.000000
faut           0.000000
Name: concerne, dtype: float32

creer


creer          1.00000
entreprise     0.26487
faut           0.00000
impots         0.00000
creation       0.00000
demarches      0.00000
entreprises    0.00000
activite       0.00000
rsi            0.00000
tout           0.00000
Name: creer, dtype: float32

rsi


rsi            1.000000
urssaf         0.190826
faut           0.000000
entreprise     0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
tout           0.000000
Name: rsi, dtype: float32

tout


tout           1.000000
entreprise     0.111524
aide           0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
rsi            0.000000
faut           0.000000
Name: tout, dtype: float32

auto


auto            1.000000
entrepreneur    0.764912
entreprise      0.136617
faut            0.000000
impots          0.000000
creation        0.000000
demarches       0.000000
entreprises     0.000000
activite        0.000000
rsi             0.000000
Name: auto, dtype: float32

faire


faire          1.000000
entreprise     0.123606
faut           0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
rsi            0.000000
tout           0.000000
Name: faire, dtype: float32

demarches


demarches      1.0
faut           0.0
aide           0.0
impots         0.0
creation       0.0
entreprises    0.0
activite       0.0
rsi            0.0
entreprise     0.0
tout           0.0
Name: demarches, dtype: float32

commerce


commerce       1.0
faut           0.0
entreprise     0.0
impots         0.0
creation       0.0
demarches      0.0
entreprises    0.0
activite       0.0
rsi            0.0
tout           0.0
Name: commerce, dtype: float32

entrepreneur


entrepreneur    1.00000
auto            0.58445
faut            0.00000
entreprise      0.00000
impots          0.00000
creation        0.00000
demarches       0.00000
entreprises     0.00000
activite        0.00000
rsi             0.00000
Name: entrepreneur, dtype: float32

impots


impots         1.0
faut           0.0
aide           0.0
creation       0.0
demarches      0.0
entreprises    0.0
activite       0.0
rsi            0.0
entreprise     0.0
tout           0.0
Name: impots, dtype: float32

faut


faut           1.0
aide           0.0
impots         0.0
creation       0.0
demarches      0.0
entreprises    0.0
activite       0.0
rsi            0.0
entreprise     0.0
tout           0.0
Name: faut, dtype: float32

entreprises


entreprises    1.0
faut           0.0
aide           0.0
impots         0.0
creation       0.0
demarches      0.0
activite       0.0
rsi            0.0
entreprise     0.0
tout           0.0
Name: entreprises, dtype: float32

aide


aide           1.000000
entreprise     0.094796
faut           0.000000
impots         0.000000
creation       0.000000
demarches      0.000000
entreprises    0.000000
activite       0.000000
rsi            0.000000
tout           0.000000
Name: aide, dtype: float32

activite


activite       1.0
faut           0.0
aide           0.0
impots         0.0
creation       0.0
demarches      0.0
entreprises    0.0
rsi            0.0
entreprise     0.0
tout           0.0
Name: activite, dtype: float32

In [149]:
for i in df_qu_27_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_27[i].sort_values(ascending=False).head(10))

entreprise


entreprise    0.000929
creer         0.000640
creation      0.000540
auto          0.000366
aide          0.000347
faire         0.000342
tout          0.000297
urssaf        0.000246
non                NaN
impots             NaN
Name: entreprise, dtype: float32

non


non            0.001353
concerne       0.000752
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
entreprise          NaN
tout                NaN
Name: non, dtype: float32

creation


creation        0.001449
entreprise      0.000540
non                  NaN
impots               NaN
demarches            NaN
entreprises          NaN
activite             NaN
rsi                  NaN
tout                 NaN
entrepreneur         NaN
Name: creation, dtype: float32

urssaf


urssaf         0.001835
rsi            0.000491
entreprise     0.000246
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
tout                NaN
Name: urssaf, dtype: float32

concerne


concerne       0.001992
non            0.000752
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
entreprise          NaN
tout                NaN
Name: concerne, dtype: float32

creer


creer          0.002415
entreprise     0.000640
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
tout                NaN
Name: creer, dtype: float32

rsi


rsi            0.002571
urssaf         0.000491
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
entreprise          NaN
tout                NaN
Name: rsi, dtype: float32

tout


tout            0.002660
entreprise      0.000297
non                  NaN
impots               NaN
creation             NaN
demarches            NaN
entreprises          NaN
activite             NaN
rsi                  NaN
entrepreneur         NaN
Name: tout, dtype: float32

auto


auto            0.002681
entrepreneur    0.002051
entreprise      0.000366
non                  NaN
impots               NaN
creation             NaN
demarches            NaN
entreprises          NaN
activite             NaN
rsi                  NaN
Name: auto, dtype: float32

faire


faire          0.002770
entreprise     0.000342
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
tout                NaN
Name: faire, dtype: float32

demarches


demarches       0.002959
non                  NaN
impots               NaN
creation             NaN
entreprises          NaN
activite             NaN
rsi                  NaN
entreprise           NaN
tout                 NaN
entrepreneur         NaN
Name: demarches, dtype: float32

commerce


commerce       0.003436
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
entreprise          NaN
tout                NaN
Name: commerce, dtype: float32

entrepreneur


entrepreneur    0.003509
auto            0.002051
non                  NaN
impots               NaN
creation             NaN
demarches            NaN
entreprises          NaN
activite             NaN
rsi                  NaN
entreprise           NaN
Name: entrepreneur, dtype: float32

impots


impots          0.003509
non                  NaN
creation             NaN
demarches            NaN
entreprises          NaN
activite             NaN
rsi                  NaN
entreprise           NaN
tout                 NaN
entrepreneur         NaN
Name: impots, dtype: float32

faut


faut           0.003546
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
entreprise          NaN
tout                NaN
Name: faut, dtype: float32

entreprises


entreprises     0.003597
non                  NaN
impots               NaN
creation             NaN
demarches            NaN
activite             NaN
rsi                  NaN
entreprise           NaN
tout                 NaN
entrepreneur         NaN
Name: entreprises, dtype: float32

aide


aide           0.003663
entreprise     0.000347
non                 NaN
impots              NaN
creation            NaN
demarches           NaN
entreprises         NaN
activite            NaN
rsi                 NaN
tout                NaN
Name: aide, dtype: float32

activite


activite        0.003922
non                  NaN
impots               NaN
creation             NaN
demarches            NaN
entreprises          NaN
rsi                  NaN
entreprise           NaN
tout                 NaN
entrepreneur         NaN
Name: activite, dtype: float32

In [150]:
gc.collect()

133

# Question 28: Si vous avez été amené à recruter du personnel, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [151]:
question_28 = "Si vous avez été amené à recruter du personnel, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_28,df_qu_28_one_hot,df_cov_28,df_confidence_28,df_lift_28 = compute_similarities(question_28, new_res)

In [152]:
for i in df_qu_28_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_28[i].sort_values(ascending=False).head(10))

emploi


emploi       1178
pole          979
travail       117
recruter      111
concerne        0
personnel       0
non             0
Name: emploi, dtype: uint16

pole


pole         997
emploi       979
concerne       0
recruter       0
personnel      0
travail        0
non            0
Name: pole, dtype: uint16

non


non          686
concerne     268
recruter       0
personnel      0
travail        0
pole           0
emploi         0
Name: non, dtype: uint16

concerne


concerne     471
non          268
recruter       0
personnel      0
travail        0
pole           0
emploi         0
Name: concerne, dtype: uint16

travail


travail      379
emploi       117
concerne       0
recruter       0
personnel      0
pole           0
non            0
Name: travail, dtype: uint16

personnel


personnel    284
concerne       0
recruter       0
travail        0
pole           0
emploi         0
non            0
Name: personnel, dtype: uint16

recruter


recruter     255
emploi       111
concerne       0
personnel      0
travail        0
pole           0
non            0
Name: recruter, dtype: uint16

In [153]:
for i in df_qu_28_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_28[i].sort_values(ascending=False).head(10))

emploi


emploi       1.000000
pole         0.981946
recruter     0.435294
travail      0.308707
concerne     0.000000
personnel    0.000000
non          0.000000
Name: emploi, dtype: float32

pole


pole         1.00000
emploi       0.83107
concerne     0.00000
recruter     0.00000
personnel    0.00000
travail      0.00000
non          0.00000
Name: pole, dtype: float32

non


non          1.000000
concerne     0.569002
recruter     0.000000
personnel    0.000000
travail      0.000000
pole         0.000000
emploi       0.000000
Name: non, dtype: float32

concerne


concerne     1.000000
non          0.390671
recruter     0.000000
personnel    0.000000
travail      0.000000
pole         0.000000
emploi       0.000000
Name: concerne, dtype: float32

travail


travail      1.000000
emploi       0.099321
concerne     0.000000
recruter     0.000000
personnel    0.000000
pole         0.000000
non          0.000000
Name: travail, dtype: float32

personnel


personnel    1.0
concerne     0.0
recruter     0.0
travail      0.0
pole         0.0
emploi       0.0
non          0.0
Name: personnel, dtype: float32

recruter


recruter     1.000000
emploi       0.094228
concerne     0.000000
personnel    0.000000
travail      0.000000
pole         0.000000
non          0.000000
Name: recruter, dtype: float32

In [154]:
for i in df_qu_28_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_28[i].sort_values(ascending=False).head(10))

emploi


emploi       0.000849
pole         0.000834
recruter     0.000370
travail      0.000262
non               NaN
personnel         NaN
concerne          NaN
Name: emploi, dtype: float32

pole


pole         0.001003
emploi       0.000834
non               NaN
travail           NaN
personnel         NaN
recruter          NaN
concerne          NaN
Name: pole, dtype: float32

non


non          0.001458
concerne     0.000829
emploi            NaN
pole              NaN
travail           NaN
personnel         NaN
recruter          NaN
Name: non, dtype: float32

concerne


concerne     0.002123
non          0.000829
emploi            NaN
pole              NaN
travail           NaN
personnel         NaN
recruter          NaN
Name: concerne, dtype: float32

travail


travail      0.002639
emploi       0.000262
non               NaN
pole              NaN
personnel         NaN
recruter          NaN
concerne          NaN
Name: travail, dtype: float32

personnel


personnel    0.003521
non               NaN
emploi            NaN
pole              NaN
travail           NaN
recruter          NaN
concerne          NaN
Name: personnel, dtype: float32

recruter


recruter     0.003922
emploi       0.000370
non               NaN
pole              NaN
travail           NaN
personnel         NaN
concerne          NaN
Name: recruter, dtype: float32

In [155]:
gc.collect()

238

# Question 29: Si vous avez été amené à former du personnel, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [156]:
question_29 = "Si vous avez été amené à former du personnel, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_29,df_qu_29_one_hot,df_cov_29,df_confidence_29,df_lift_29 = compute_similarities(question_29, new_res)

In [157]:
for i in df_qu_29_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_29[i].sort_values(ascending=False).head(10))

formation


formation     718
formations    115
concerne        0
non             0
Name: formation, dtype: uint16

non


non           634
concerne      259
formations      0
formation       0
Name: non, dtype: uint16

concerne


concerne      474
non           259
formations      0
formation       0
Name: concerne, dtype: uint16

formations


formations    318
formation     115
concerne        0
non             0
Name: formations, dtype: uint16

In [158]:
for i in df_qu_29_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_29[i].sort_values(ascending=False).head(10))

formation


formation     1.000000
formations    0.361635
concerne      0.000000
non           0.000000
Name: formation, dtype: float32

non


non           1.000000
concerne      0.546413
formations    0.000000
formation     0.000000
Name: non, dtype: float32

concerne


concerne      1.000000
non           0.408517
formations    0.000000
formation     0.000000
Name: concerne, dtype: float32

formations


formations    1.000000
formation     0.160167
concerne      0.000000
non           0.000000
Name: formations, dtype: float32

In [159]:
for i in df_qu_29_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_29[i].sort_values(ascending=False).head(10))

formation


formation     0.001393
formations    0.000504
non                NaN
concerne           NaN
Name: formation, dtype: float32

non


non           0.001577
concerne      0.000862
formation          NaN
formations         NaN
Name: non, dtype: float32

concerne


concerne      0.002110
non           0.000862
formation          NaN
formations         NaN
Name: concerne, dtype: float32

formations


formations    0.003145
formation     0.000504
non                NaN
concerne           NaN
Name: formations, dtype: float32

In [160]:
gc.collect()

175

# Question 30:  Si vous avez été amené à rémunérer du personnel, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [161]:
question_30 = "Si vous avez été amené à rémunérer du personnel, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_30,df_qu_30_one_hot,df_cov_30,df_confidence_30,df_lift_30 = compute_similarities(question_30, new_res)

In [162]:
for i in df_qu_30_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_30[i].sort_values(ascending=False).head(10))

non


non         603
concerne    252
urssaf        0
cesu          0
travail       0
charges       0
Name: non, dtype: uint16

charges


charges     444
concerne      0
urssaf        0
cesu          0
travail       0
non           0
Name: charges, dtype: uint16

concerne


concerne    442
non         252
urssaf        0
cesu          0
travail       0
charges       0
Name: concerne, dtype: uint16

urssaf


urssaf      290
concerne      0
cesu          0
travail       0
charges       0
non           0
Name: urssaf, dtype: uint16

cesu


cesu        284
concerne      0
urssaf        0
travail       0
charges       0
non           0
Name: cesu, dtype: uint16

travail


travail     255
concerne      0
urssaf        0
cesu          0
charges       0
non           0
Name: travail, dtype: uint16

In [163]:
for i in df_qu_30_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_30[i].sort_values(ascending=False).head(10))

non


non         1.000000
concerne    0.570136
urssaf      0.000000
cesu        0.000000
travail     0.000000
charges     0.000000
Name: non, dtype: float32

charges


charges     1.0
concerne    0.0
urssaf      0.0
cesu        0.0
travail     0.0
non         0.0
Name: charges, dtype: float32

concerne


concerne    1.00000
non         0.41791
urssaf      0.00000
cesu        0.00000
travail     0.00000
charges     0.00000
Name: concerne, dtype: float32

urssaf


urssaf      1.0
concerne    0.0
cesu        0.0
travail     0.0
charges     0.0
non         0.0
Name: urssaf, dtype: float32

cesu


cesu        1.0
concerne    0.0
urssaf      0.0
travail     0.0
charges     0.0
non         0.0
Name: cesu, dtype: float32

travail


travail     1.0
concerne    0.0
urssaf      0.0
cesu        0.0
charges     0.0
non         0.0
Name: travail, dtype: float32

In [164]:
for i in df_qu_30_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_30[i].sort_values(ascending=False).head(10))

non


non         0.001658
concerne    0.000945
charges          NaN
travail          NaN
cesu             NaN
urssaf           NaN
Name: non, dtype: float32

charges


charges     0.002252
non              NaN
travail          NaN
cesu             NaN
urssaf           NaN
concerne         NaN
Name: charges, dtype: float32

concerne


concerne    0.002262
non         0.000945
charges          NaN
travail          NaN
cesu             NaN
urssaf           NaN
Name: concerne, dtype: float32

urssaf


urssaf      0.003448
non              NaN
charges          NaN
travail          NaN
cesu             NaN
concerne         NaN
Name: urssaf, dtype: float32

cesu


cesu        0.003521
non              NaN
charges          NaN
travail          NaN
urssaf           NaN
concerne         NaN
Name: cesu, dtype: float32

travail


travail     0.003922
non              NaN
charges          NaN
cesu             NaN
urssaf           NaN
concerne         NaN
Name: travail, dtype: float32

In [165]:
gc.collect()

217

# Question 31: Si vous avez été amené à mettre fin à votre activité, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [166]:
question_31 = "Si vous avez été amené à mettre fin à votre activité, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_31,df_qu_31_one_hot,df_cov_31,df_confidence_31,df_lift_31 = compute_similarities(question_31, new_res)

In [167]:
for i in df_qu_31_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_31[i].sort_values(ascending=False).head(10))

non


non         627
concerne    251
activite      0
Name: non, dtype: uint16

concerne


concerne    441
non         251
activite      0
Name: concerne, dtype: uint16

activite


activite    330
concerne      0
non           0
Name: activite, dtype: uint16

In [168]:
for i in df_qu_31_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_31[i].sort_values(ascending=False).head(10))

non


non         1.000000
concerne    0.569161
activite    0.000000
Name: non, dtype: float32

concerne


concerne    1.000000
non         0.400319
activite    0.000000
Name: concerne, dtype: float32

activite


activite    1.0
concerne    0.0
non         0.0
Name: activite, dtype: float32

In [169]:
for i in df_qu_31_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_31[i].sort_values(ascending=False).head(10))

non


non         0.001595
concerne    0.000908
activite         NaN
Name: non, dtype: float32

concerne


concerne    0.002268
non         0.000908
activite         NaN
Name: concerne, dtype: float32

activite


activite    0.00303
non             NaN
concerne        NaN
Name: activite, dtype: float32

In [170]:
gc.collect()

21

# Question 32:  Si vous avez été amené à recruter une personne portant un handicap, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :

In [171]:
question_32 = "Si vous avez été amené à recruter une personne portant un handicap, pouvez-vous indiquer les éléments de satisfaction et/ou les difficultés rencontrés en précisant, pour chaque point, l'administration concernée :"
qu_32,df_qu_32_one_hot,df_cov_32,df_confidence_32,df_lift_32 = compute_similarities(question_32, new_res)

In [172]:
for i in df_qu_32_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_32[i].sort_values(ascending=False).head(10))

non


non         698
concerne    304
Name: non, dtype: uint16

concerne


concerne    528
non         304
Name: concerne, dtype: uint16

In [173]:
for i in df_qu_32_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_32[i].sort_values(ascending=False).head(10))

non


non         1.000000
concerne    0.575758
Name: non, dtype: float32

concerne


concerne    1.00000
non         0.43553
Name: concerne, dtype: float32

In [174]:
for i in df_qu_32_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_32[i].sort_values(ascending=False).head(10))

non


non         0.001433
concerne    0.000825
Name: non, dtype: float32

concerne


concerne    0.001894
non         0.000825
Name: concerne, dtype: float32

In [175]:
gc.collect()

14

# Question 33:  Y a-t-il d'autres points sur l'organisation de l'Etat et des services publics sur lesquels vous souhaiteriez vous exprimer ?

In [176]:
question_33 = "Y a-t-il d'autres points sur l'organisation de l'Etat et des services publics sur lesquels vous souhaiteriez vous exprimer ?"
qu_33,df_qu_33_one_hot,df_cov_33,df_confidence_33,df_lift_33 = compute_similarities(question_33, new_res)

In [177]:
for i in df_qu_33_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_33[i].sort_values(ascending=False).head(10))

faut


faut        7970
faire       6050
tout        5961
service     5654
temps       5650
francais    5620
citoyens    5604
mettre      5571
securite    5534
vitesse     5527
Name: faut, dtype: uint16

faire


faire        7825
faut         6050
tout         6014
temps        5715
service      5705
citoyens     5631
francais     5630
mettre       5606
securite     5594
politique    5511
Name: faire, dtype: uint16

tout


tout         7575
faire        6014
faut         5961
temps        5668
francais     5591
service      5589
citoyens     5522
mettre       5512
securite     5482
politique    5436
Name: tout, dtype: uint16

service


service      6779
faire        5705
faut         5654
tout         5589
citoyens     5483
temps        5446
mettre       5445
securite     5410
francais     5400
politique    5392
Name: service, dtype: uint16

temps


temps       6514
faire       5715
tout        5668
faut        5650
francais    5460
service     5446
citoyens    5425
vitesse     5409
securite    5401
mettre      5397
Name: temps, dtype: uint16

citoyens


citoyens        6496
faire           5631
faut            5604
tout            5522
service         5483
francais        5425
politique       5425
temps           5425
securite        5419
gouvernement    5394
Name: citoyens, dtype: uint16

francais


francais    6343
faire       5630
faut        5620
tout        5591
temps       5460
citoyens    5425
service     5400
mesure      5400
securite    5399
vitesse     5395
Name: francais, dtype: uint16

mettre


mettre       6237
faire        5606
faut         5571
tout         5512
service      5445
temps        5397
politique    5392
francais     5388
securite     5385
citoyens     5377
Name: mettre, dtype: uint16

securite


securite    6134
faire       5594
faut        5534
vitesse     5493
tout        5482
routiere    5473
80          5434
km          5428
citoyens    5419
routes      5418
Name: securite, dtype: uint16

vitesse


vitesse        5951
km             5663
80             5656
limitation     5632
routes         5546
faut           5527
route          5496
securite       5493
mesure         5485
conducteurs    5474
Name: vitesse, dtype: uint16

80


80            5944
km            5769
vitesse       5656
limitation    5580
faut          5514
routes        5504
mesure        5458
faire         5436
route         5436
securite      5434
Name: 80, dtype: uint16

politique


politique       5939
faire           5511
faut            5482
tout            5436
citoyens        5425
mettre          5392
service         5392
francais        5390
securite        5379
gouvernement    5374
Name: politique, dtype: uint16

km


km            5907
80            5769
vitesse       5663
limitation    5561
routes        5496
faut          5489
mesure        5454
revenir       5432
securite      5428
reseau        5426
Name: km, dtype: uint16

lieu


lieu            5854
faire           5499
faut            5462
tout            5416
vitesse         5403
temps           5397
securite        5396
gouvernement    5382
citoyens        5381
francais        5375
Name: lieu, dtype: uint16

gouvernement


gouvernement    5800
faire           5458
faut            5449
securite        5395
citoyens        5394
tout            5393
vitesse         5392
francais        5387
lieu            5382
politique       5374
Name: gouvernement, dtype: uint16

limitation


limitation     5773
vitesse        5632
80             5580
km             5561
faut           5474
routes         5462
mesure         5441
reseau         5438
revenir        5428
conducteurs    5406
Name: limitation, dtype: uint16

routes


routes        5757
vitesse       5546
80            5504
km            5496
limitation    5462
securite      5418
faut          5409
faire         5404
route         5392
radars        5381
Name: routes, dtype: uint16

mesure


mesure        5740
vitesse       5485
faut          5477
80            5458
km            5454
limitation    5441
faire         5408
francais      5400
reseau        5394
securite      5386
Name: mesure, dtype: uint16

revenir


revenir        5721
faut           5496
vitesse        5449
km             5432
limitation     5428
80             5423
mesure         5385
abaissement    5382
reseau         5379
secondaire     5371
Name: revenir, dtype: uint16

route


route          5641
vitesse        5496
80             5436
km             5426
securite       5408
limitation     5393
routes         5392
faire          5388
routiere       5374
conducteurs    5366
Name: route, dtype: uint16

In [178]:
for i in df_qu_33_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_33[i].sort_values(ascending=False).head(10))

faut


faut               1.000000
biaisee            0.994160
flashent           0.993873
probants           0.993602
rallonges          0.992615
injustement        0.992453
colles             0.991709
detourner          0.990714
experimentation    0.990099
imposee            0.989803
Name: faut, dtype: float32

faire


faire          1.000000
racket         0.992060
flashent       0.990427
detourner      0.989956
obligeant      0.988447
inutilement    0.988264
rives          0.988260
reduite        0.986578
rallonges      0.986366
injustement    0.986226
Name: faire, dtype: float32

tout


tout           1.000000
flashent       0.998468
rallonges      0.984851
injustement    0.984151
colles         0.982476
racket         0.980718
detourner      0.979913
trajet         0.979726
penalise       0.979416
biaisee        0.979088
Name: tout, dtype: float32

service


service        1.000000
racket         0.990548
flashent       0.989661
detourner      0.988630
obligeant      0.987121
injustement    0.986604
inutilement    0.986561
rives          0.985987
rallonges      0.985798
veiller        0.984940
Name: service, dtype: float32

temps


temps          1.000000
rallonges      0.999432
trajet         0.996809
flashent       0.996171
injustement    0.994717
colles         0.994159
penalise       0.989334
detourner      0.988251
obligeant      0.987311
probants       0.986639
Name: temps, dtype: float32

citoyens


citoyens          1.000000
detourner         0.996399
obligeant         0.995833
inutilement       0.992618
rives             0.992615
reduite           0.992250
laissez           0.991509
flashent          0.990427
indispensables    0.989891
rallonges         0.988260
Name: citoyens, dtype: float32

francais


francais           1.000000
probants           0.996048
biaisee            0.996044
flashent           0.994256
injustement        0.991887
rallonges          0.991290
experimentation    0.990473
colles             0.989825
detourner          0.988061
obligeant          0.987500
Name: francais, dtype: float32

mettre


mettre         1.000000
racket         0.989414
detourner      0.989388
flashent       0.989278
obligeant      0.987311
inutilement    0.985993
rives          0.985798
injustement    0.985660
rallonges      0.985419
veiller        0.984375
Name: mettre, dtype: float32

securite


securite       1.000000
detourner      0.997726
rives          0.996781
obligeant      0.995076
inutilement    0.994700
reduite        0.993762
racket         0.993006
laissez        0.992642
flashent       0.992342
rallonges      0.991100
Name: securite, dtype: float32

vitesse


vitesse        1.000000
rives          0.999432
biaisee        0.999246
flashent       0.999043
probants       0.998871
rallonges      0.998864
detourner      0.998863
colles         0.998681
injustement    0.998113
abaissement    0.997973
Name: vitesse, dtype: float32

80


80                 1.000000
biaisee            0.994348
flashent           0.994256
probants           0.994166
rallonges          0.992994
colles             0.992651
injustement        0.992264
abaissement        0.992075
rives              0.991290
experimentation    0.991220
Name: 80, dtype: float32

politique


politique      1.000000
racket         0.991493
detourner      0.990146
flashent       0.990044
obligeant      0.987689
rives          0.987313
inutilement    0.987128
injustement    0.986604
rallonges      0.986366
colles         0.985868
Name: politique, dtype: float32

km


km                 1.000000
flashent           0.994448
probants           0.994355
biaisee            0.994348
colles             0.993217
rallonges          0.993183
injustement        0.992642
abaissement        0.991891
experimentation    0.991407
rives              0.991290
Name: km, dtype: float32

lieu


lieu           1.000000
detourner      0.998484
rives          0.996402
obligeant      0.995833
inutilement    0.994511
flashent       0.994448
reduite        0.993573
rallonges      0.992615
laissez        0.992075
injustement    0.992075
Name: lieu, dtype: float32

gouvernement


gouvernement    1.000000
detourner       0.997536
obligeant       0.994886
flashent        0.994639
rives           0.994509
injustement     0.993208
inutilement     0.992996
rallonges       0.992615
colles          0.992086
reduite         0.991871
Name: gouvernement, dtype: float32

limitation


limitation         1.000000
flashent           0.999043
probants           0.998495
biaisee            0.998493
rallonges          0.997917
colles             0.997550
injustement        0.996604
experimentation    0.994769
abaissement        0.994655
detourner          0.994125
Name: limitation, dtype: float32

routes


routes         1.000000
flashent       0.993299
veiller        0.991905
colles         0.991144
rallonges      0.991100
injustement    0.990566
racket         0.989603
detourner      0.989577
rives          0.989396
obligeant      0.986553
Name: routes, dtype: float32

mesure


mesure             1.000000
biaisee            0.998493
probants           0.998306
flashent           0.996171
injustement        0.995472
rallonges          0.995266
colles             0.995101
experimentation    0.994769
imposee            0.993326
detourner          0.991851
Name: mesure, dtype: float32

revenir


revenir            1.000000
flashent           0.994831
biaisee            0.993783
probants           0.993414
rallonges          0.992804
injustement        0.992264
abaissement        0.991891
colles             0.991521
detourner          0.989388
experimentation    0.988791
Name: revenir, dtype: float32

route


route          1.000000
detourner      0.998294
rives          0.998106
obligeant      0.995833
inutilement    0.994700
reduite        0.993384
compteur       0.992114
laissez        0.992075
flashent       0.990618
colles         0.987564
Name: route, dtype: float32

In [179]:
for i in df_qu_33_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_33[i].sort_values(ascending=False).head(10))

faut


faut               0.000125
biaisee            0.000125
flashent           0.000125
probants           0.000125
rallonges          0.000125
injustement        0.000125
colles             0.000124
detourner          0.000124
experimentation    0.000124
imposee            0.000124
Name: faut, dtype: float32

faire


faire          0.000128
racket         0.000127
flashent       0.000127
detourner      0.000127
obligeant      0.000126
inutilement    0.000126
rives          0.000126
reduite        0.000126
rallonges      0.000126
injustement    0.000126
Name: faire, dtype: float32

tout


tout           0.000132
flashent       0.000132
rallonges      0.000130
injustement    0.000130
colles         0.000130
racket         0.000129
detourner      0.000129
trajet         0.000129
penalise       0.000129
biaisee        0.000129
Name: tout, dtype: float32

service


service        0.000148
racket         0.000146
flashent       0.000146
detourner      0.000146
obligeant      0.000146
injustement    0.000146
inutilement    0.000146
rives          0.000145
rallonges      0.000145
veiller        0.000145
Name: service, dtype: float32

temps


temps          0.000154
rallonges      0.000153
trajet         0.000153
flashent       0.000153
injustement    0.000153
colles         0.000153
penalise       0.000152
detourner      0.000152
obligeant      0.000152
probants       0.000151
Name: temps, dtype: float32

citoyens


citoyens          0.000154
detourner         0.000153
obligeant         0.000153
inutilement       0.000153
rives             0.000153
reduite           0.000153
laissez           0.000153
flashent          0.000152
indispensables    0.000152
rallonges         0.000152
Name: citoyens, dtype: float32

francais


francais           0.000158
probants           0.000157
biaisee            0.000157
flashent           0.000157
injustement        0.000156
rallonges          0.000156
experimentation    0.000156
colles             0.000156
detourner          0.000156
obligeant          0.000156
Name: francais, dtype: float32

mettre


mettre         0.000160
racket         0.000159
detourner      0.000159
flashent       0.000159
obligeant      0.000158
inutilement    0.000158
rives          0.000158
injustement    0.000158
rallonges      0.000158
veiller        0.000158
Name: mettre, dtype: float32

securite


securite       0.000163
detourner      0.000163
rives          0.000163
obligeant      0.000162
inutilement    0.000162
reduite        0.000162
racket         0.000162
laissez        0.000162
flashent       0.000162
rallonges      0.000162
Name: securite, dtype: float32

vitesse


vitesse        0.000168
rives          0.000168
biaisee        0.000168
flashent       0.000168
probants       0.000168
rallonges      0.000168
detourner      0.000168
colles         0.000168
injustement    0.000168
abaissement    0.000168
Name: vitesse, dtype: float32

80


80                 0.000168
biaisee            0.000167
flashent           0.000167
probants           0.000167
rallonges          0.000167
colles             0.000167
injustement        0.000167
abaissement        0.000167
rives              0.000167
experimentation    0.000167
Name: 80, dtype: float32

politique


politique      0.000168
racket         0.000167
detourner      0.000167
flashent       0.000167
obligeant      0.000166
rives          0.000166
inutilement    0.000166
injustement    0.000166
rallonges      0.000166
colles         0.000166
Name: politique, dtype: float32

km


km                 0.000169
flashent           0.000168
probants           0.000168
biaisee            0.000168
colles             0.000168
rallonges          0.000168
injustement        0.000168
abaissement        0.000168
experimentation    0.000168
rives              0.000168
Name: km, dtype: float32

lieu


lieu           0.000171
detourner      0.000171
rives          0.000170
obligeant      0.000170
inutilement    0.000170
flashent       0.000170
reduite        0.000170
rallonges      0.000170
laissez        0.000169
injustement    0.000169
Name: lieu, dtype: float32

gouvernement


gouvernement    0.000172
detourner       0.000172
obligeant       0.000172
flashent        0.000171
rives           0.000171
injustement     0.000171
inutilement     0.000171
rallonges       0.000171
colles          0.000171
reduite         0.000171
Name: gouvernement, dtype: float32

limitation


limitation         0.000173
flashent           0.000173
probants           0.000173
biaisee            0.000173
rallonges          0.000173
colles             0.000173
injustement        0.000173
experimentation    0.000172
abaissement        0.000172
detourner          0.000172
Name: limitation, dtype: float32

routes


routes         0.000174
flashent       0.000173
veiller        0.000172
colles         0.000172
rallonges      0.000172
injustement    0.000172
racket         0.000172
detourner      0.000172
rives          0.000172
obligeant      0.000171
Name: routes, dtype: float32

mesure


mesure             0.000174
biaisee            0.000174
probants           0.000174
flashent           0.000174
injustement        0.000173
rallonges          0.000173
colles             0.000173
experimentation    0.000173
imposee            0.000173
detourner          0.000173
Name: mesure, dtype: float32

revenir


revenir            0.000175
flashent           0.000174
biaisee            0.000174
probants           0.000174
rallonges          0.000174
injustement        0.000173
abaissement        0.000173
colles             0.000173
detourner          0.000173
experimentation    0.000173
Name: revenir, dtype: float32

route


route          0.000177
detourner      0.000177
rives          0.000177
obligeant      0.000177
inutilement    0.000176
reduite        0.000176
compteur       0.000176
laissez        0.000176
flashent       0.000176
colles         0.000175
Name: route, dtype: float32

In [180]:
gc.collect()

105