In [1]:
import os, sys
import unidecode
import re
import json
import gc

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Ce notebook analyse les réponses aux questions en cherchant des liens entre les mots les plus utilisés, dans le but de comprendre les demandes les plus récurrentes des francais.

Dans un premier temps, les réponses sont préprocessées et transformées en liste de mots-clés. Puis, pour chaque réponse, úne analyse basique de la proximité des mots est réalisée. Bien que simple, cette methode permet de faire apparaitre des thèmes récurrents et de comprendre la teneur générale de ces demandes.

Les trois métriques utilisées sont :
+ co-occurence des mots : $co-occurence(i, j) = \sum_{users} 1_{i \in user} 1_{j \in user}$
+ confiance : $confiance(i -> j) = P(j | i)$
+ lift : $lift(i, j) = \frac{P(i \cap j)}{P(i)P(j)}$

La co-occurence permet d'évaluer les mots présents de manière commune, et donne une première idée des thèmes généraux.

La confiance donne une idée de la présence de $j$ quand $i$ est déjà présent : il surpondère les mots peu présents par rapport à la co-occurence.

Le lift estime le surplus de présence commune de $i$ et $j$ par rapport au cas où $i$ et $j$ sont indépendants. Cela permet de trouver des relations de causalité plus intéressantes, notamment dans des cas où certains mots sont peu présents mais très liés.

Pour chaque question :
+ On récupère les mots les plus employés sur ce thème
+ Pour chacun de ces mots, on regarde pour chaque métrique les mots les plus liés, ce qui donne une bonne idée des liens et des demandes

On peut ensuite raffiner l'analyse sur des mots moins présents mais porteurs de sens.

In [2]:
# function definitions

def compute_similarities(question_name, df_res):
    qu = df_res[question_name].dropna()
    df_qu_one_hot = compute_one_hot(qu)
    df_cov = compute_covariance(df_qu_one_hot)
    df_confidence = compute_confidence(df_cov)
    df_lift = compute_lift(df_cov, df_qu_one_hot)
    
    return qu, df_qu_one_hot, df_cov, df_confidence, df_lift
    
def compute_one_hot(qu):
    qu_words = []
    for i in qu:
        qu_words.extend(i)
    qu_words = list(set(qu_words))
    dic_qu_words = {word:i for i, word in enumerate(qu_words)}
    dic_qu_words_inverse = {i:word for i, word in enumerate(qu_words)}
    
    qu_one_hot = np.zeros((len(qu), len(qu_words)), dtype=bool)
    for i, li_word in enumerate(qu):
        for word in li_word:
            qu_one_hot[i, dic_qu_words[word]] = True
            
    df_qu_one_hot = pd.DataFrame(columns=qu_words, data=qu_one_hot).to_sparse(fill_value=False)

    
    temp_mask = np.sum(df_qu_one_hot.values, axis=0, dtype=np.uint16) > 250
    words_enough = df_qu_one_hot.columns.values[temp_mask]
    df_qu_one_hot = df_qu_one_hot[words_enough].to_sparse(fill_value=0)
    
    del temp_mask
    del qu_one_hot
    gc.collect()
    
    return df_qu_one_hot

def compute_covariance(df_qu_one_hot):
    N = df_qu_one_hot.shape[1]
    
    cov = np.zeros((N, N), dtype=np.uint16)
    np.matmul(df_qu_one_hot.values.T, df_qu_one_hot.values, out=cov)
    
    df_cov = pd.DataFrame(columns=df_qu_one_hot.columns, index=df_qu_one_hot.columns, data=cov) * (cov > 100)
    del cov
    gc.collect()
    
    return df_cov

def compute_confidence(df_cov):
    df_confidence = np.diag(1 / np.diag(df_cov)).dot(df_cov).astype(np.float32)
    df_confidence = pd.DataFrame(index=df_cov.index, columns=df_cov.index, data=df_confidence)
    return df_confidence

def compute_lift(df_cov, df_qu_one_hot):
    inv_diag_cov = 1 / np.diag(df_cov.values)
    lift = inv_diag_cov.reshape((-1, 1)) * df_cov.values * inv_diag_cov.reshape((1, -1))
    df_lift = pd.DataFrame(columns=df_qu_one_hot.columns,
                             index=df_qu_one_hot.columns,
                             data=lift).replace(0.0, np.nan).astype(np.float32)
    del lift
    del inv_diag_cov
    gc.collect()
    
    return df_lift

# Loading of files and preprocessing

In [3]:
PATH_TO_FILE = "./proposals_cleaned/ecologie.json"

In [4]:
with open(PATH_TO_FILE, "r") as f:
    raw_json = [s.strip() for s in f.readlines()]
    
parsed_json = [json.loads(raw_json[i]) for i in range(len(raw_json))]
del raw_json

In [5]:
col = ["titre"]
for ques in parsed_json[0]["responses"]:
    col.append(ques["question"]["id"]) 
        
data = []
for elt in parsed_json:
    resp = {"titre" : elt["titre"]}
    for ques in elt["responses"]:
        try:
            text = json.loads((ques["value"]))
            resp[ques["question"]["title"]] = ''
            if text["labels"] != []:
                resp[ques["question"]["title"]] += ", ".join(text["labels"])
            if text["other"] is not None:
                resp[ques["question"]["title"]] += ", " + text["other"]
            if resp[ques["question"]["title"]] == '':
                resp[ques["question"]["title"]] = np.nan
        except:
            if ques["value"] is not None and ques["value"][0] != "{":
                resp[ques["question"]["title"]] = ques["value"]
            else:
                resp[ques["question"]["title"]] = np.nan
    data.append(resp)

In [6]:
res = pd.DataFrame.from_dict(data)
del data
gc.collect()

0

In [7]:
res.shape

(52430, 17)

In [8]:
0.910319 * 52430

47728.02517

In [9]:
res.notna().mean(axis=0).sort_values(ascending=False)

titre                                                                                                                                                                                                                                                  1.000000
Quel est aujourd'hui pour vous le problème concret le plus important dans le domaine de l'environnement ?                                                                                                                                              0.946004
Diriez-vous que votre vie quotidienne est aujourd'hui touchée par le changement climatique ?                                                                                                                                                           0.911406
À titre personnel, pensez-vous pouvoir contribuer à protéger l'environnement ?                                                                                                                                                          

# Find important words

In [10]:
li_word_count = []
for elt in res.values:
    for item in elt:
        if type(item) == str:
            li_word_count.extend([unidecode.unidecode(x.lower()) for x in re.findall(r'\w+', item)])

In [11]:
dic_word_count = {}
for i in li_word_count:
    if len(i) > 0:
        if i in dic_word_count.keys():
            dic_word_count[i] +=1
        else:
            dic_word_count[i] = 1

In [12]:
df_word_count = pd.DataFrame.from_dict(dic_word_count, orient="index")
df_word_count.sort_values(0, ascending=False)
df_word_count.columns = ["freq_in_debate"]

In [13]:
del li_word_count
del dic_word_count

gc.collect()

202

In [14]:
df_word_count = df_word_count[df_word_count["freq_in_debate"] > 100]

In [15]:
li_stopwords = [unidecode.unidecode(x.strip().lower()) for x in open("french_stopwords.txt", 'r').readlines()]
li_stopwords = set(li_stopwords)
li_stopwords.remove("aucun")
li_stopwords.remove("tout")
li_stopwords.remove("tous")
li_stopwords.remove("non")

In [16]:
new_data = []
for i, elt in enumerate(res.index):
    temp_res = []
    for col in res.columns:
        item = res.loc[elt, col]
        if type(item) == str:
            li_item = [unidecode.unidecode(x.lower()) for x in re.findall(r'\w+', item) if unidecode.unidecode(x.lower()) not in li_stopwords]
            temp_res.append(li_item)
        else:
            temp_res.append(None)
    new_data.append(temp_res)

In [17]:
new_res = pd.DataFrame(new_data, columns=res.columns).to_sparse()
del new_data
gc.collect()

0

# Question 1 : Quel est aujourd'hui pour vous le problème concret le plus important dans le domaine de l'environnement ?

In [18]:
question_1 = "Quel est aujourd'hui pour vous le problème concret le plus important dans le domaine de l'environnement ?"
qu_1,df_qu_1_one_hot,df_cov_1,df_confidence_1,df_lift_1 = compute_similarities(question_1,new_res)

In [19]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_1[i].sort_values(ascending=False).head(10))

climatiques


climatiques     14449
dereglements    14339
secheresse      13853
crue            13844
pollution         389
biodiversite      373
air               343
disparition       228
especes           218
erosion           179
Name: climatiques, dtype: uint16

dereglements


dereglements    14431
climatiques     14339
secheresse      13849
crue            13843
pollution         378
biodiversite      371
air               329
disparition       215
especes           210
erosion           179
Name: dereglements, dtype: uint16

secheresse


secheresse         13889
climatiques        13853
crue               13849
dereglements       13849
reponses               0
air                    0
lie                    0
non                    0
importants             0
surconsommation        0
Name: secheresse, dtype: uint16

crue


crue               13849
secheresse         13849
climatiques        13844
dereglements       13843
reponses               0
air                    0
lie                    0
non                    0
importants             0
surconsommation        0
Name: crue, dtype: uint16

pollution


pollution       12625
air             11014
biodiversite      663
eau               596
sols              455
climatique        430
disparition       409
climatiques       389
dereglements      378
especes           372
Name: pollution, dtype: uint16

air


air             11349
pollution       11014
biodiversite      557
eau               545
disparition       349
climatiques       343
dereglements      329
especes           329
climatique        317
sols              284
Name: air, dtype: uint16

biodiversite


biodiversite    10067
disparition      9201
especes          9126
pollution         663
air               557
climatique        393
climatiques       373
dereglements      371
dereglement       305
erosion           295
Name: biodiversite, dtype: uint16

disparition


disparition     9558
especes         9336
biodiversite    9201
pollution        409
air              349
climatiques      228
dereglements     215
climatique       186
erosion          177
dereglement      159
Name: disparition, dtype: uint16

especes


especes         9483
disparition     9336
biodiversite    9126
pollution        372
air              329
climatiques      218
dereglements     210
erosion          157
climatique       143
littoral         131
Name: especes, dtype: uint16

tous


tous          2566
problemes      855
importants     513
lies           494
pollution      249
tout           193
air            186
points         169
probleme       169
important      167
Name: tous, dtype: uint16

tout


tout             2208
lie               568
important         398
pollution         292
air               220
tous              193
biodiversite      184
probleme          177
problemes         172
environnement     163
Name: tout, dtype: uint16

problemes


problemes       1400
tous             855
lies             354
importants       317
tout             172
pollution        160
ensemble         126
biodiversite     120
air              112
probleme         105
Name: problemes, dtype: uint16

climatique


climatique       1087
dereglement       541
pollution         430
biodiversite      393
rechauffement     387
air               317
disparition       186
erosion           159
tout              143
especes           143
Name: climatique, dtype: uint16

eau


eau                1020
pollution           596
air                 545
sols                213
biodiversite        141
terre               134
environnement         0
non                   0
importants            0
surconsommation       0
Name: eau, dtype: uint16

dechets


dechets            870
pollution          176
reponses             0
ressources           0
crue                 0
non                  0
importants           0
surconsommation      0
vie                  0
dereglements         0
Name: dechets, dtype: uint16

probleme


probleme           771
tout               177
tous               169
important          164
pollution          124
problemes          105
environnement        0
non                  0
importants           0
surconsommation      0
Name: probleme, dtype: uint16

erosion


erosion         744
littoral        578
pollution       316
biodiversite    295
air             274
dereglements    179
climatiques     179
disparition     177
climatique      159
especes         157
Name: erosion, dtype: uint16

lies


lies               722
tous               494
problemes          354
importants         137
environnement        0
crue                 0
non                  0
surconsommation      0
vie                  0
dereglements         0
Name: lies, dtype: uint16

environnement


environnement      717
tout               163
tous               128
pollution          109
crue                 0
non                  0
importants           0
surconsommation      0
vie                  0
dereglements         0
Name: environnement, dtype: uint16

sols


sols               674
pollution          455
air                284
eau                213
biodiversite       127
reponses             0
environnement        0
non                  0
importants           0
surconsommation      0
Name: sols, dtype: uint16

In [20]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_1[i].sort_values(ascending=False).head(10))

climatiques


climatiques     1.000000
crue            0.999639
secheresse      0.997408
dereglements    0.993625
littoral        0.257426
erosion         0.240591
tout            0.046196
biodiversite    0.037052
pollution       0.030812
air             0.030223
Name: climatiques, dtype: float32

dereglements


dereglements    1.000000
crue            0.999567
secheresse      0.997120
climatiques     0.992387
littoral        0.245875
erosion         0.240591
biodiversite    0.036853
pollution       0.029941
air             0.028989
disparition     0.022494
Name: dereglements, dtype: float32

secheresse


crue               1.000000
secheresse         1.000000
dereglements       0.959670
climatiques        0.958751
reponses           0.000000
air                0.000000
lie                0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
Name: secheresse, dtype: float32

crue


crue               1.000000
secheresse         0.997120
dereglements       0.959254
climatiques        0.958129
reponses           0.000000
air                0.000000
lie                0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
Name: crue, dtype: float32

pollution


pollution      1.000000
air            0.970482
oceans         0.685185
sols           0.675074
eau            0.584314
dereglement    0.546440
terre          0.432802
erosion        0.424731
climatique     0.395584
littoral       0.394389
Name: pollution, dtype: float32

air


air            1.000000
pollution      0.872396
eau            0.534314
terre          0.441913
sols           0.421365
pollutions     0.402299
dereglement    0.400929
erosion        0.368280
littoral       0.363036
climatique     0.291628
Name: air, dtype: float32

biodiversite


biodiversite    1.000000
disparition     0.962649
especes         0.962354
dereglement     0.472136
erosion         0.396505
climatique      0.361546
littoral        0.339934
sols            0.188427
eau             0.138235
problemes       0.085714
Name: biodiversite, dtype: float32

disparition


disparition     1.000000
especes         0.984499
biodiversite    0.913976
dereglement     0.246130
erosion         0.237903
littoral        0.234323
climatique      0.171113
tout            0.046649
pollution       0.032396
air             0.030752
Name: disparition, dtype: float32

especes


especes         1.000000
disparition     0.976773
biodiversite    0.906526
littoral        0.216172
erosion         0.211022
dereglement     0.174923
climatique      0.131555
tout            0.047101
pollution       0.029465
air             0.028989
Name: especes, dtype: float32

tous


tous             1.000000
importants       0.773756
lies             0.684211
points           0.623616
problemes        0.610714
faut             0.341667
important        0.248143
probleme         0.219196
environnement    0.178522
climatique       0.114075
Name: tous, dtype: float32

tout


tout             1.000000
lie              0.928105
important        0.591382
faut             0.318750
probleme         0.229572
environnement    0.227336
ensemble         0.194969
erosion          0.143817
climatique       0.131555
problemes        0.122857
Name: tout, dtype: float32

problemes


problemes       1.000000
lies            0.490305
importants      0.478130
tous            0.333203
ensemble        0.198113
important       0.150074
probleme        0.136187
tout            0.077899
pollution       0.012673
biodiversite    0.011920
Name: problemes, dtype: float32

climatique


climatique       1.000000
dereglement      0.837461
rechauffement    0.809623
erosion          0.213710
littoral         0.168317
tout             0.064764
tous             0.048324
biodiversite     0.039038
pollution        0.034059
air              0.027932
Name: climatique, dtype: float32

eau


eau                1.000000
sols               0.316024
terre              0.305239
air                0.048022
pollution          0.047208
biodiversite       0.014006
environnement      0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
Name: eau, dtype: float32

dechets


dechets            1.000000
pollution          0.013941
reponses           0.000000
ressources         0.000000
crue               0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
vie                0.000000
dereglements       0.000000
Name: dechets, dtype: float32

probleme


probleme           1.000000
important          0.243685
tout               0.080163
problemes          0.075000
tous               0.065861
pollution          0.009822
environnement      0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
Name: probleme, dtype: float32

erosion


erosion         1.000000
littoral        0.953795
dereglement     0.201238
climatique      0.146274
tout            0.048460
biodiversite    0.029304
pollution       0.025030
air             0.024143
disparition     0.018519
especes         0.016556
Name: erosion, dtype: float32

lies


lies               1.000000
problemes          0.252857
importants         0.206637
tous               0.192518
environnement      0.000000
crue               0.000000
non                0.000000
surconsommation    0.000000
vie                0.000000
dereglements       0.000000
Name: lies, dtype: float32

environnement


environnement      1.000000
tout               0.073822
tous               0.049883
pollution          0.008634
crue               0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
vie                0.000000
dereglements       0.000000
Name: environnement, dtype: float32

sols


sols               1.000000
eau                0.208824
pollution          0.036040
air                0.025024
biodiversite       0.012615
reponses           0.000000
environnement      0.000000
non                0.000000
importants         0.000000
surconsommation    0.000000
Name: sols, dtype: float32

In [21]:
for i in df_qu_1_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_1[i].sort_values(ascending=False).head(10))

climatiques


climatiques     0.000069
crue            0.000069
secheresse      0.000069
dereglements    0.000069
littoral        0.000018
erosion         0.000017
tout            0.000003
biodiversite    0.000003
pollution       0.000002
air             0.000002
Name: climatiques, dtype: float32

dereglements


dereglements    0.000069
crue            0.000069
secheresse      0.000069
climatiques     0.000069
littoral        0.000017
erosion         0.000017
biodiversite    0.000003
pollution       0.000002
air             0.000002
disparition     0.000002
Name: dereglements, dtype: float32

secheresse


crue            0.000072
secheresse      0.000072
dereglements    0.000069
climatiques     0.000069
terre                NaN
energie              NaN
lies                 NaN
faut                 NaN
agriculture          NaN
climatique           NaN
Name: secheresse, dtype: float32

crue


crue            0.000072
secheresse      0.000072
dereglements    0.000069
climatiques     0.000069
terre                NaN
energie              NaN
lies                 NaN
faut                 NaN
agriculture          NaN
climatique           NaN
Name: crue, dtype: float32

pollution


pollution      0.000079
air            0.000077
oceans         0.000054
sols           0.000053
eau            0.000046
dereglement    0.000043
terre          0.000034
erosion        0.000034
climatique     0.000031
littoral       0.000031
Name: pollution, dtype: float32

air


air            0.000088
pollution      0.000077
eau            0.000047
terre          0.000039
sols           0.000037
pollutions     0.000035
dereglement    0.000035
erosion        0.000032
littoral       0.000032
climatique     0.000026
Name: air, dtype: float32

biodiversite


biodiversite    0.000099
disparition     0.000096
especes         0.000096
dereglement     0.000047
erosion         0.000039
climatique      0.000036
littoral        0.000034
sols            0.000019
eau             0.000014
problemes       0.000009
Name: biodiversite, dtype: float32

disparition


disparition     0.000105
especes         0.000103
biodiversite    0.000096
dereglement     0.000026
erosion         0.000025
littoral        0.000025
climatique      0.000018
tout            0.000005
pollution       0.000003
air             0.000003
Name: disparition, dtype: float32

especes


especes         0.000105
disparition     0.000103
biodiversite    0.000096
littoral        0.000023
erosion         0.000022
dereglement     0.000018
climatique      0.000014
tout            0.000005
pollution       0.000003
air             0.000003
Name: especes, dtype: float32

tous


tous             0.000390
importants       0.000302
lies             0.000267
points           0.000243
problemes        0.000238
faut             0.000133
important        0.000097
probleme         0.000085
environnement    0.000070
climatique       0.000044
Name: tous, dtype: float32

tout


tout             0.000453
lie              0.000420
important        0.000268
faut             0.000144
probleme         0.000104
environnement    0.000103
ensemble         0.000088
erosion          0.000065
climatique       0.000060
problemes        0.000056
Name: tout, dtype: float32

problemes


problemes       0.000714
lies            0.000350
importants      0.000342
tous            0.000238
ensemble        0.000142
important       0.000107
probleme        0.000097
tout            0.000056
pollution       0.000009
biodiversite    0.000009
Name: problemes, dtype: float32

climatique


climatique       0.000920
dereglement      0.000770
rechauffement    0.000745
erosion          0.000197
littoral         0.000155
tout             0.000060
tous             0.000044
biodiversite     0.000036
pollution        0.000031
air              0.000026
Name: climatique, dtype: float32

eau


eau             0.000980
sols            0.000310
terre           0.000299
air             0.000047
pollution       0.000046
biodiversite    0.000014
energie              NaN
lies                 NaN
faut                 NaN
climatiques          NaN
Name: eau, dtype: float32

dechets


dechets        0.001149
pollution      0.000016
terre               NaN
energie             NaN
lies                NaN
faut                NaN
climatiques         NaN
secheresse          NaN
agriculture         NaN
climatique          NaN
Name: dechets, dtype: float32

probleme


probleme     0.001297
important    0.000316
tout         0.000104
problemes    0.000097
tous         0.000085
pollution    0.000013
terre             NaN
energie           NaN
lies              NaN
faut              NaN
Name: probleme, dtype: float32

erosion


erosion         0.001344
littoral        0.001282
dereglement     0.000270
climatique      0.000197
tout            0.000065
biodiversite    0.000039
pollution       0.000034
air             0.000032
disparition     0.000025
especes         0.000022
Name: erosion, dtype: float32

lies


lies           0.001385
problemes      0.000350
importants     0.000286
tous           0.000267
terre               NaN
energie             NaN
faut                NaN
climatiques         NaN
secheresse          NaN
agriculture         NaN
Name: lies, dtype: float32

environnement


environnement    0.001395
tout             0.000103
tous             0.000070
pollution        0.000012
terre                 NaN
energie               NaN
lies                  NaN
faut                  NaN
climatiques           NaN
secheresse            NaN
Name: environnement, dtype: float32

sols


sols            0.001484
eau             0.000310
pollution       0.000053
air             0.000037
biodiversite    0.000019
terre                NaN
energie              NaN
lies                 NaN
faut                 NaN
climatiques          NaN
Name: sols, dtype: float32

In [22]:
gc.collect()

285

# Question 2 : Que faudrait-il faire selon vous pour apporter des réponses à ce problème ?

In [23]:
question_2 = "Que faudrait-il faire selon vous pour apporter des réponses à ce problème ?"
qu_2,df_qu_2_one_hot,df_cov_2,df_confidence_2,df_lift_2 = compute_similarities(question_2,new_res)

In [24]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_2[i].sort_values(ascending=False).head(10))

faire


faire          6889
tout           1675
faut           1647
tous           1578
produits       1364
entreprises    1213
non            1182
france         1179
exemple        1157
mettre         1040
Name: faire, dtype: uint16

produits


produits        5947
tous            1475
taxer           1448
interdire       1419
faire           1364
agriculture     1225
consommation    1207
non             1192
entreprises     1180
tout            1158
Name: produits, dtype: uint16

tous


tous           5886
faire          1578
produits       1475
faut           1260
tout           1233
non            1055
transports     1003
entreprises    1002
france          973
pays            963
Name: tous, dtype: uint16

transports


transports     5312
commun         2236
developper     1515
taxer          1091
favoriser      1076
transport      1073
faire          1030
produits       1017
tous           1003
entreprises     967
Name: transports, dtype: uint16

tout


tout           5262
faire          1675
faut           1435
tous           1233
produits       1158
non            1054
monde          1027
exemple         974
entreprises     891
mettre          883
Name: tout, dtype: uint16

faut


faut           5042
faire          1647
tout           1435
tous           1260
produits       1064
exemple         978
france          957
non             957
entreprises     879
mettre          853
Name: faut, dtype: uint16

entreprises


entreprises    4696
faire          1213
taxer          1181
produits       1180
tous           1002
transports      967
tout            891
faut            879
non             852
ecologique      790
Name: entreprises, dtype: uint16

taxer


taxer          4516
produits       1448
entreprises    1181
transports     1091
faire           860
transport       810
interdire       805
pollueurs       795
developper      795
tous            790
Name: taxer, dtype: uint16

non


non            4436
produits       1192
faire          1182
tous           1055
tout           1054
faut            957
transports      880
entreprises     852
exemple         784
france          750
Name: non, dtype: uint16

developper


developper    4417
transports    1515
energies      1035
commun         947
transport      887
faire          862
produits       861
taxer          795
energie        791
tous           753
Name: developper, dtype: uint16

interdire


interdire      4004
produits       1419
pesticides     1001
tous            886
taxer           805
faire           789
tout            781
agriculture     763
transports      700
non             689
Name: interdire, dtype: uint16

mettre


mettre         3973
place          1845
faire          1040
tous            931
tout            883
faut            853
produits        810
transports      750
entreprises     733
non             701
Name: mettre, dtype: uint16

consommation


consommation    3960
produits        1207
production       973
faire            926
reduire          876
faut             834
tous             832
energie          817
tout             811
transports       711
Name: consommation, dtype: uint16

reduire


reduire         3908
consommation     876
transports       829
produits         808
faire            712
pollution        673
tous             643
faut             638
tout             618
developper       611
Name: reduire, dtype: uint16

pollution


pollution      3896
faire           995
air             957
tous            854
faut            839
tout            830
transports      811
produits        787
entreprises     728
non             696
Name: pollution, dtype: uint16

france


france        3807
faire         1179
tous           973
pays           971
faut           957
produits       924
tout           829
exemple        751
non            750
transports     705
Name: france, dtype: uint16

energies


energies         3644
renouvelables    1657
fossiles         1062
developper       1035
energie           840
transports        792
nucleaire         721
faire             708
non               666
produits          653
Name: energies, dtype: uint16

exemple


exemple        3630
faire          1157
faut            978
tout            974
produits        947
tous            939
non             784
france          751
transports      741
entreprises     733
Name: exemple, dtype: uint16

favoriser


favoriser      3612
transports     1076
produits       1003
agriculture     776
taxer           707
entreprises     690
faire           689
transport       674
developper      673
tous            649
Name: favoriser, dtype: uint16

agriculture


agriculture    3602
produits       1225
bio             972
pesticides      906
favoriser       776
interdire       763
tous            746
faire           745
tout            686
biologique      686
Name: agriculture, dtype: uint16

In [25]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_2[i].sort_values(ascending=False).head(10))

faire


faire         1.000000
sorte         0.797647
payer         0.646586
croire        0.616725
savoir        0.561828
comprendre    0.543253
pourra        0.538941
chose         0.516765
veut          0.506329
veulent       0.492063
Name: faire, dtype: float32

produits


produits           1.000000
importes           0.955711
phytosanitaires    0.891720
issus              0.755906
nocifs             0.737864
toxiques           0.716292
chimiques          0.665698
importation        0.651219
alimentaires       0.630357
tva                0.613197
Name: produits, dtype: float32

tous


tous           1.000000
niveaux        0.755952
domaines       0.673961
jours          0.536842
accessibles    0.492188
acteurs        0.477807
majorite       0.445312
lies           0.424929
7              0.424354
6              0.420485
Name: tous, dtype: float32

transports


transports     1.000000
communs        0.871227
gratuits       0.843990
commun         0.789827
aeriens        0.776243
gratuite       0.733813
collectifs     0.678733
routiers       0.671082
maritimes      0.623786
covoiturage    0.597633
Name: transports, dtype: float32

tout


tout          1.000000
simplement    0.549708
monde         0.473490
veut          0.440506
7             0.424354
petit         0.422572
mal           0.419118
or            0.413043
pouvons       0.407143
contraire     0.400763
Name: tout, dtype: float32

faut


faut          1.000000
veut          0.445570
oui           0.444853
ensuite       0.437220
pourra        0.433022
comprendre    0.404844
agit          0.396325
pouvons       0.392857
jamais        0.387173
savoir        0.384409
Name: faut, dtype: float32

entreprises


entreprises      1.000000
francaises       0.496988
teletravail      0.440171
grosses          0.437647
particuliers     0.426418
polluantes       0.405912
entreprise       0.401418
collectivites    0.388502
impot            0.371490
total            0.363354
Name: entreprises, dtype: float32

taxer


taxer         1.000000
kerosene      0.681402
lourdement    0.596491
importes      0.531469
compagnies    0.468750
fortement     0.457486
traversent    0.456929
etrangers     0.452991
aerien        0.428850
aeriens       0.419890
Name: taxer, dtype: float32

non


non            1.000000
recyclables    0.600000
polluante      0.433180
oui            0.397059
etudes         0.354232
or             0.345109
respect        0.329545
agit           0.325459
cas            0.324182
6              0.320755
Name: non, dtype: float32

developper


developper     1.000000
cyclables      0.449664
pistes         0.412943
ferroutage     0.406458
ferroviaire    0.392670
filiere        0.369973
filieres       0.364261
fret           0.357868
hydrogene      0.355243
eolien         0.346715
Name: developper, dtype: float32

interdire


interdire        1.000000
glyphosate       0.467331
elevages         0.423664
chasse           0.415339
vente            0.409561
palme            0.406250
importation      0.404878
nocifs           0.391586
huile            0.382637
immediatement    0.378472
Name: interdire, dtype: float32

mettre


mettre        1.000000
oeuvre        0.603338
place         0.578370
fin           0.431670
consignes     0.340694
trains        0.315992
industriel    0.302381
systemes      0.296296
programme     0.287234
pourraient    0.277542
Name: mettre, dtype: float32

consommation


consommation    1.000000
viande          0.490427
biens           0.409483
publicite       0.387218
habitudes       0.375000
modes           0.363436
obsolescence    0.361446
programmee      0.357798
locale          0.353008
objets          0.349206
Name: consommation, dtype: float32

reduire


reduire          1.000000
drastiquement    0.443124
emissions        0.377721
consommations    0.320210
serre            0.300173
empreinte        0.273418
viande           0.266568
trajets          0.257500
gaz              0.251541
emission         0.243354
Name: reduire, dtype: float32

pollution


pollution       1.000000
erosion         0.539007
air             0.538851
dereglements    0.424837
littoral        0.401163
particules      0.347339
sources         0.341253
climatiques     0.333333
oceans          0.330460
disparition     0.325885
Name: pollution, dtype: float32

france


france        1.000000
traversent    0.636704
etranger      0.493151
millions      0.461774
allemagne     0.431925
7             0.416974
inde          0.414062
europe        0.410058
etrangers     0.408547
000           0.387205
Name: france, dtype: float32

energies


energies         1.000000
renouvelables    0.918006
fossiles         0.843527
vertes           0.509740
eolien           0.442822
nucleaire        0.386388
recours          0.379433
solaire          0.377880
propres          0.359734
nucleaires       0.345550
Name: energies, dtype: float32

exemple


exemple       1.000000
montrer       0.722527
titre         0.364261
6             0.323450
pourraient    0.322034
or            0.296196
ensuite       0.293722
5             0.280423
cas           0.279831
point         0.277419
Name: exemple, dtype: float32

favoriser


favoriser      1.000000
courts         0.411576
circuits       0.409651
proximite      0.345304
covoiturage    0.325444
favorisant     0.317073
locale         0.313280
locaux         0.289871
biologique     0.288973
elevage        0.283262
Name: favoriser, dtype: float32

agriculture


agriculture        1.000000
biologique         0.869455
intensive          0.822414
raisonnee          0.721402
respectueuse       0.672241
permaculture       0.534247
elevage            0.515021
exploitations      0.498371
agro               0.437909
phytosanitaires    0.423567
Name: agriculture, dtype: float32

In [26]:
for i in df_qu_2_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_2[i].sort_values(ascending=False).head(10))

faire


faire         0.000145
sorte         0.000116
payer         0.000094
croire        0.000090
savoir        0.000082
comprendre    0.000079
pourra        0.000078
chose         0.000075
veut          0.000073
veulent       0.000071
Name: faire, dtype: float32

produits


produits           0.000168
importes           0.000161
phytosanitaires    0.000150
issus              0.000127
nocifs             0.000124
toxiques           0.000120
chimiques          0.000112
importation        0.000110
alimentaires       0.000106
tva                0.000103
Name: produits, dtype: float32

tous


tous           0.000170
niveaux        0.000128
domaines       0.000115
jours          0.000091
accessibles    0.000084
acteurs        0.000081
majorite       0.000076
lies           0.000072
7              0.000072
6              0.000071
Name: tous, dtype: float32

transports


transports     0.000188
communs        0.000164
gratuits       0.000159
commun         0.000149
aeriens        0.000146
gratuite       0.000138
collectifs     0.000128
routiers       0.000126
maritimes      0.000117
covoiturage    0.000113
Name: transports, dtype: float32

tout


tout          0.000190
simplement    0.000104
monde         0.000090
veut          0.000084
7             0.000081
petit         0.000080
mal           0.000080
or            0.000078
pouvons       0.000077
contraire     0.000076
Name: tout, dtype: float32

faut


faut          0.000198
veut          0.000088
oui           0.000088
ensuite       0.000087
pourra        0.000086
comprendre    0.000080
agit          0.000079
pouvons       0.000078
jamais        0.000077
savoir        0.000076
Name: faut, dtype: float32

entreprises


entreprises      0.000213
francaises       0.000106
teletravail      0.000094
grosses          0.000093
particuliers     0.000091
polluantes       0.000086
entreprise       0.000085
collectivites    0.000083
impot            0.000079
total            0.000077
Name: entreprises, dtype: float32

taxer


taxer         0.000221
kerosene      0.000151
lourdement    0.000132
importes      0.000118
compagnies    0.000104
fortement     0.000101
traversent    0.000101
etrangers     0.000100
aerien        0.000095
aeriens       0.000093
Name: taxer, dtype: float32

non


non            0.000225
recyclables    0.000135
polluante      0.000098
oui            0.000090
etudes         0.000080
or             0.000078
respect        0.000074
agit           0.000073
cas            0.000073
6              0.000072
Name: non, dtype: float32

developper


developper     0.000226
cyclables      0.000102
pistes         0.000093
ferroutage     0.000092
ferroviaire    0.000089
filiere        0.000084
filieres       0.000082
fret           0.000081
hydrogene      0.000080
eolien         0.000078
Name: developper, dtype: float32

interdire


interdire        0.000250
glyphosate       0.000117
elevages         0.000106
chasse           0.000104
vente            0.000102
palme            0.000101
importation      0.000101
nocifs           0.000098
huile            0.000096
immediatement    0.000095
Name: interdire, dtype: float32

mettre


mettre        0.000252
oeuvre        0.000152
place         0.000146
fin           0.000109
consignes     0.000086
trains        0.000080
industriel    0.000076
systemes      0.000075
programme     0.000072
pourraient    0.000070
Name: mettre, dtype: float32

consommation


consommation    0.000253
viande          0.000124
biens           0.000103
publicite       0.000098
habitudes       0.000095
modes           0.000092
obsolescence    0.000091
programmee      0.000090
locale          0.000089
objets          0.000088
Name: consommation, dtype: float32

reduire


reduire          0.000256
drastiquement    0.000113
emissions        0.000097
consommations    0.000082
serre            0.000077
empreinte        0.000070
viande           0.000068
trajets          0.000066
gaz              0.000064
emission         0.000062
Name: reduire, dtype: float32

pollution


pollution       0.000257
erosion         0.000138
air             0.000138
dereglements    0.000109
littoral        0.000103
particules      0.000089
sources         0.000088
climatiques     0.000086
oceans          0.000085
disparition     0.000084
Name: pollution, dtype: float32

france


france        0.000263
traversent    0.000167
etranger      0.000130
millions      0.000121
allemagne     0.000113
7             0.000110
inde          0.000109
europe        0.000108
etrangers     0.000107
000           0.000102
Name: france, dtype: float32

energies


energies         0.000274
renouvelables    0.000252
fossiles         0.000231
vertes           0.000140
eolien           0.000122
nucleaire        0.000106
recours          0.000104
solaire          0.000104
propres          0.000099
nucleaires       0.000095
Name: energies, dtype: float32

exemple


exemple       0.000275
montrer       0.000199
titre         0.000100
6             0.000089
pourraient    0.000089
or            0.000082
ensuite       0.000081
5             0.000077
cas           0.000077
point         0.000076
Name: exemple, dtype: float32

favoriser


favoriser      0.000277
courts         0.000114
circuits       0.000113
proximite      0.000096
covoiturage    0.000090
favorisant     0.000088
locale         0.000087
locaux         0.000080
biologique     0.000080
elevage        0.000078
Name: favoriser, dtype: float32

agriculture


agriculture        0.000278
biologique         0.000241
intensive          0.000228
raisonnee          0.000200
respectueuse       0.000187
permaculture       0.000148
elevage            0.000143
exploitations      0.000138
agro               0.000122
phytosanitaires    0.000118
Name: agriculture, dtype: float32

In [27]:
gc.collect()

98

# Question 3 : Diriez-vous que votre vie quotidienne est aujourd'hui touchée par le changement climatique ?

In [28]:
question_3 = "Diriez-vous que votre vie quotidienne est aujourd'hui touchée par le changement climatique ?"
qu_3,df_qu_3_one_hot,df_cov_3,df_confidence_3,df_lift_3 = compute_similarities(question_3, new_res)

In [29]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_3[i].sort_values(ascending=False).head(10))

oui


oui    31023
non        0
Name: oui, dtype: uint16

non


non    16762
oui        0
Name: non, dtype: uint16

In [30]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_3[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [31]:
for i in df_qu_3_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_3[i].sort_values(ascending=False).head(10))

oui


oui    0.000032
non         NaN
Name: oui, dtype: float32

non


non    0.00006
oui        NaN
Name: non, dtype: float32

In [32]:
gc.collect()

14

# Question 4 : Si oui, de quelle manière votre vie quotidienne est-elle touchée par le changement climatique ?

In [33]:
question_4 = "Si oui, de quelle manière votre vie quotidienne est-elle touchée par le changement climatique ?"
qu_4,df_qu_4_one_hot,df_cov_4,df_confidence_4,df_lift_4 = compute_similarities(question_4, new_res)

In [34]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_4[i].sort_values(ascending=False).head(10))

pollution


pollution      4978
air            2400
eau             453
climatique      417
disparition     385
sante           383
secheresse      371
climatiques     314
ville           309
especes         296
Name: pollution, dtype: uint16

air


air            3696
pollution      2400
qualite         631
eau             498
pollue          315
climatique      288
sante           276
disparition     275
secheresse      251
ville           243
Name: air, dtype: uint16

secheresse


secheresse     3192
inondations     406
eau             387
pollution       371
periodes        360
canicule        312
chaleur         294
air             251
tempetes        251
climatiques     242
Name: secheresse, dtype: uint16

saisons


saisons         2422
dereglement      366
marquees         291
secheresse       219
pollution        218
temperatures     216
air              181
disparition      178
hiver            173
climatiques      170
Name: saisons, dtype: uint16

climatique


climatique       2231
changement       1039
dereglement       591
rechauffement     444
pollution         417
vie               356
air               288
quotidienne       179
tous              177
eau               167
Name: climatique, dtype: uint16

climatiques


climatiques     2108
phenomenes       401
evenements       368
pollution        314
extremes         279
dereglements     251
secheresse       242
inondations      235
air              230
violents         218
Name: climatiques, dtype: uint16

eau


eau            1987
air             498
pollution       453
secheresse      387
manque          324
climatique      167
chaleur         152
disparition     145
changement      141
especes         137
Name: eau, dtype: uint16

inondations


inondations    1787
secheresse      406
tempetes        388
climatiques     235
secheresses     226
pollution       196
canicules       187
frequentes      146
saisons         138
canicule        136
Name: inondations, dtype: uint16

changement


changement     1661
climatique     1039
vie             310
pollution       230
climat          184
saisons         164
air             163
quotidienne     158
tous            144
eau             141
Name: changement, dtype: uint16

temperatures


temperatures    1656
hausse           253
augmentation     238
saisons          216
pollution        216
air              176
secheresse       170
extremes         134
hiver            132
climatiques      128
Name: temperatures, dtype: uint16

disparition


disparition     1637
especes          737
oiseaux          502
pollution        385
insectes         378
air              275
abeilles         247
biodiversite     198
animales         197
secheresse       186
Name: disparition, dtype: uint16

chaleur


chaleur        1626
secheresse      294
pollution       225
air             157
eau             152
forte           142
pics            141
periodes        111
hiver           111
inondations     105
Name: chaleur, dtype: uint16

oiseaux


oiseaux        1444
insectes        621
disparition     502
abeilles        283
especes         255
pollution       227
air             186
secheresse      168
jardin          148
saisons         143
Name: oiseaux, dtype: uint16

canicule


canicule       1421
secheresse      312
pollution       208
periodes        169
air             147
inondations     136
episodes        134
tempetes        114
hiver           101
visible           0
Name: canicule, dtype: uint16

tempetes


tempetes       1418
inondations     388
secheresse      251
climatiques     208
frequentes      180
canicules       178
secheresses     135
phenomenes      130
saisons         130
pollution       120
Name: tempetes, dtype: uint16

especes


especes        1417
disparition     737
animales        352
pollution       296
oiseaux         255
air             226
insectes        180
climatiques     166
climatique      161
saisons         157
Name: especes, dtype: uint16

vie


vie            1378
quotidienne     452
climatique      356
changement      310
touchee         187
pollution       177
tous            162
climatiques     152
air             133
tout            132
Name: vie, dtype: uint16

canicules


canicules      1272
inondations     187
tempetes        178
frequentes      168
pollution       167
secheresses     135
climatiques     115
air             110
chauffage         0
produits          0
Name: canicules, dtype: uint16

sante


sante            1267
pollution         383
air               276
problemes         252
impact            123
environnement       0
dereglements        0
chaud               0
caniculaires        0
produits            0
Name: sante, dtype: uint16

climat


climat           1253
pollution         196
changement        184
air               120
change            104
dereglement       102
saisons           102
environnement       0
dereglements        0
chaud               0
Name: climat, dtype: uint16

In [35]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_4[i].sort_values(ascending=False).head(10))

pollution


pollution        1.000000
atmospherique    0.945017
air              0.649351
pics             0.589977
villes           0.492929
paris            0.444056
sols             0.434010
pesticides       0.430939
ville            0.420408
grandes          0.369565
Name: pollution, dtype: float32

air


air             1.000000
pollue          0.779703
qualite         0.747630
pollution       0.482121
paris           0.409091
pesticides      0.386740
alimentation    0.370466
sols            0.352792
villes          0.343434
ville           0.330612
Name: air, dtype: float32

secheresse


secheresse    1.000000
periodes      0.374610
periode       0.346457
inondation    0.338200
pluie         0.309524
pluies        0.268260
sols          0.256345
crues         0.252654
jardin        0.241497
episodes      0.227785
Name: secheresse, dtype: float32

saisons


saisons         1.000000
marquees        0.941748
dereglement     0.317708
modification    0.268170
hiver           0.141571
temperatures    0.130435
insectes        0.111765
especes         0.110797
disparition     0.108735
oiseaux         0.099030
Name: saisons, dtype: float32

climatique


climatique       1.000000
changement       0.625527
rechauffement    0.582677
dereglement      0.513021
effets           0.377224
touchee          0.347594
quotidienne      0.339015
touche           0.291028
consequences     0.272265
vie              0.258345
Name: climatique, dtype: float32

climatiques


climatiques     1.000000
evenements      0.687850
dereglements    0.674731
phenomenes      0.450562
extremes        0.429892
changements     0.333874
violents        0.322009
frequents       0.303030
catastrophes    0.215463
episodes        0.211514
Name: climatiques, dtype: float32

eau


eau             1.000000
manque          0.517572
consommation    0.258228
sols            0.256345
jardin          0.183673
qualite         0.156398
air             0.134740
secheresse      0.121241
neige           0.111354
periodes        0.111342
Name: eau, dtype: float32

inondations


inondations     1.000000
tempetes        0.273625
secheresses     0.258286
frequentes      0.193634
violents        0.152142
catastrophes    0.147022
canicules       0.147013
pluies          0.140770
secheresse      0.127193
phenomenes      0.122472
Name: inondations, dtype: float32

changement


changement     1.000000
climatique     0.465710
quotidienne    0.299242
touchee        0.286096
touche         0.234136
vie            0.224964
quotidien      0.193490
monde          0.181552
tous           0.154011
impact         0.153740
Name: changement, dtype: float32

temperatures


temperatures    1.000000
hausse          0.515275
extremes        0.206471
augmentation    0.196694
hiver           0.108020
saisons         0.089182
tempetes        0.075458
inondations     0.066592
climatiques     0.060721
eau             0.053850
Name: temperatures, dtype: float32

disparition


disparition     1.000000
animales        0.522546
especes         0.520113
abeilles        0.397746
oiseaux         0.347645
insectes        0.317647
faune           0.237209
biodiversite    0.195266
dereglement     0.088542
climatiques     0.081594
Name: disparition, dtype: float32

chaleur


chaleur        1.000000
forte          0.438272
pics           0.321185
periodes       0.115505
secheresse     0.092105
hiver          0.090835
eau            0.076497
inondations    0.058758
pollution      0.045199
air            0.042478
Name: chaleur, dtype: float32

oiseaux


oiseaux         1.000000
insectes        0.521849
abeilles        0.455717
disparition     0.306659
jardin          0.251701
animaux         0.224670
especes         0.179958
biodiversite    0.115385
eau             0.064922
saisons         0.059042
Name: oiseaux, dtype: float32

canicule


canicule       1.000000
periodes       0.175858
episodes       0.167710
secheresse     0.097744
hiver          0.082651
tempetes       0.080395
inondations    0.076105
pollution      0.041784
air            0.039773
visible        0.000000
Name: canicule, dtype: float32

tempetes


tempetes       1.000000
violentes      0.392617
frequentes     0.238727
inondations    0.217124
secheresses    0.154286
phenomenes     0.146067
canicules      0.139937
climatiques    0.098672
canicule       0.080225
secheresse     0.078634
Name: tempetes, dtype: float32

especes


especes         1.000000
animales        0.933687
disparition     0.450214
abeilles        0.214171
oiseaux         0.176593
insectes        0.151261
biodiversite    0.106509
changement      0.080072
climatiques     0.078748
climatique      0.072165
Name: especes, dtype: float32

vie


vie            1.000000
quotidienne    0.856061
touchee        0.500000
changement     0.186635
tous           0.173262
non            0.173045
impact         0.162050
monde          0.161054
climatique     0.159570
tout           0.144262
Name: vie, dtype: float32

canicules


canicules       1.000000
frequentes      0.222812
secheresses     0.154286
tempetes        0.125529
inondations     0.104645
climatiques     0.054554
pollution       0.033548
air             0.029762
chauffage       0.000000
caniculaires    0.000000
Name: canicules, dtype: float32

sante


sante            1.000000
problemes        0.329843
impact           0.170360
pollution        0.076939
air              0.074675
environnement    0.000000
dereglements     0.000000
chaud            0.000000
caniculaires     0.000000
produits         0.000000
Name: sante, dtype: float32

climat


climat           1.000000
change           0.383764
changement       0.110777
dereglement      0.088542
saisons          0.042114
pollution        0.039373
air              0.032468
environnement    0.000000
dereglements     0.000000
chaud            0.000000
Name: climat, dtype: float32

In [36]:
for i in df_qu_4_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_4[i].sort_values(ascending=False).head(10))

pollution


pollution        0.000201
atmospherique    0.000190
air              0.000130
pics             0.000119
villes           0.000099
paris            0.000089
sols             0.000087
pesticides       0.000087
ville            0.000084
grandes          0.000074
Name: pollution, dtype: float32

air


air             0.000271
pollue          0.000211
qualite         0.000202
pollution       0.000130
paris           0.000111
pesticides      0.000105
alimentation    0.000100
sols            0.000095
villes          0.000093
ville           0.000089
Name: air, dtype: float32

secheresse


secheresse    0.000313
periodes      0.000117
periode       0.000109
inondation    0.000106
pluie         0.000097
pluies        0.000084
sols          0.000080
crues         0.000079
jardin        0.000076
episodes      0.000071
Name: secheresse, dtype: float32

saisons


saisons         0.000413
marquees        0.000389
dereglement     0.000131
modification    0.000111
hiver           0.000058
temperatures    0.000054
insectes        0.000046
especes         0.000046
disparition     0.000045
oiseaux         0.000041
Name: saisons, dtype: float32

climatique


climatique       0.000448
changement       0.000280
rechauffement    0.000261
dereglement      0.000230
effets           0.000169
touchee          0.000156
quotidienne      0.000152
touche           0.000130
consequences     0.000122
vie              0.000116
Name: climatique, dtype: float32

climatiques


climatiques     0.000474
evenements      0.000326
dereglements    0.000320
phenomenes      0.000214
extremes        0.000204
changements     0.000158
violents        0.000153
frequents       0.000144
catastrophes    0.000102
episodes        0.000100
Name: climatiques, dtype: float32

eau


eau             0.000503
manque          0.000260
consommation    0.000130
sols            0.000129
jardin          0.000092
qualite         0.000079
air             0.000068
secheresse      0.000061
neige           0.000056
periodes        0.000056
Name: eau, dtype: float32

inondations


inondations     0.000560
tempetes        0.000153
secheresses     0.000145
frequentes      0.000108
violents        0.000085
catastrophes    0.000082
canicules       0.000082
pluies          0.000079
secheresse      0.000071
phenomenes      0.000069
Name: inondations, dtype: float32

changement


changement     0.000602
climatique     0.000280
quotidienne    0.000180
touchee        0.000172
touche         0.000141
vie            0.000135
quotidien      0.000116
monde          0.000109
tous           0.000093
impact         0.000093
Name: changement, dtype: float32

temperatures


temperatures    0.000604
hausse          0.000311
extremes        0.000125
augmentation    0.000119
hiver           0.000065
saisons         0.000054
tempetes        0.000046
inondations     0.000040
climatiques     0.000037
eau             0.000033
Name: temperatures, dtype: float32

disparition


disparition     0.000611
animales        0.000319
especes         0.000318
abeilles        0.000243
oiseaux         0.000212
insectes        0.000194
faune           0.000145
biodiversite    0.000119
dereglement     0.000054
climatiques     0.000050
Name: disparition, dtype: float32

chaleur


chaleur        0.000615
forte          0.000270
pics           0.000198
periodes       0.000071
secheresse     0.000057
hiver          0.000056
eau            0.000047
inondations    0.000036
pollution      0.000028
air            0.000026
Name: chaleur, dtype: float32

oiseaux


oiseaux         0.000693
insectes        0.000361
abeilles        0.000316
disparition     0.000212
jardin          0.000174
animaux         0.000156
especes         0.000125
biodiversite    0.000080
eau             0.000045
saisons         0.000041
Name: oiseaux, dtype: float32

canicule


canicule       0.000704
periodes       0.000124
episodes       0.000118
secheresse     0.000069
hiver          0.000058
tempetes       0.000057
inondations    0.000054
pollution      0.000029
air            0.000028
frequents           NaN
Name: canicule, dtype: float32

tempetes


tempetes       0.000705
violentes      0.000277
frequentes     0.000168
inondations    0.000153
secheresses    0.000109
phenomenes     0.000103
canicules      0.000099
climatiques    0.000070
canicule       0.000057
secheresse     0.000055
Name: tempetes, dtype: float32

especes


especes         0.000706
animales        0.000659
disparition     0.000318
abeilles        0.000151
oiseaux         0.000125
insectes        0.000107
biodiversite    0.000075
changement      0.000057
climatiques     0.000056
climatique      0.000051
Name: especes, dtype: float32

vie


vie            0.000726
quotidienne    0.000621
touchee        0.000363
changement     0.000135
tous           0.000126
non            0.000126
impact         0.000118
monde          0.000117
climatique     0.000116
tout           0.000105
Name: vie, dtype: float32

canicules


canicules      0.000786
frequentes     0.000175
secheresses    0.000121
tempetes       0.000099
inondations    0.000082
climatiques    0.000043
pollution      0.000026
air            0.000023
frequents           NaN
petits              NaN
Name: canicules, dtype: float32

sante


sante        0.000789
problemes    0.000260
impact       0.000134
pollution    0.000061
air          0.000059
frequents         NaN
petits            NaN
cout              NaN
froid             NaN
difficile         NaN
Name: sante, dtype: float32

climat


climat         0.000798
change         0.000306
changement     0.000088
dereglement    0.000071
saisons        0.000034
pollution      0.000031
air            0.000026
frequents           NaN
petits              NaN
cout                NaN
Name: climat, dtype: float32

In [37]:
gc.collect()

147

# Question 5 :  À titre personnel, pensez-vous pouvoir contribuer à protéger l'environnement ?

In [38]:
question_5 = "À titre personnel, pensez-vous pouvoir contribuer à protéger l'environnement ?"
qu_5,df_qu_5_one_hot,df_cov_5,df_confidence_5,df_lift_5 = compute_similarities(question_5, new_res)

In [39]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_5[i].sort_values(ascending=False).head(10))

oui


oui    44761
non        0
Name: oui, dtype: uint16

non


non    2967
oui       0
Name: non, dtype: uint16

In [40]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_5[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [41]:
for i in df_qu_5_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_5[i].sort_values(ascending=False).head(10))

oui


oui    0.000022
non         NaN
Name: oui, dtype: float32

non


non    0.000337
oui         NaN
Name: non, dtype: float32

In [42]:
gc.collect()

14

# Question 6 :  Si oui, que faites-vous aujourd'hui pour protéger l'environnement et/ou que pourriez-vous faire ?

In [43]:
question_6 = "Si oui, que faites-vous aujourd'hui pour protéger l'environnement et/ou que pourriez-vous faire ?"
qu_6,df_qu_6_one_hot,df_cov_6,df_confidence_6,df_lift_6 = compute_similarities(question_6, new_res)

In [44]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_6[i].sort_values(ascending=False).head(10))

dechets


dechets         13962
tri              5985
produits         3330
voiture          3189
consommation     3100
eau              2747
trie             2453
bio              2450
chauffage        2030
transports       1903
Name: dechets, dtype: uint16

tri


tri             12166
dechets          5985
selectif         4971
consommation     2516
produits         2455
voiture          2376
eau              2272
utilisation      1879
chauffage        1865
bio              1707
Name: tri, dtype: uint16

voiture


voiture         8953
dechets         3189
tri             2376
produits        2007
consommation    1857
deplacements    1608
eau             1602
bio             1593
chauffage       1546
velo            1494
Name: voiture, dtype: uint16

produits


produits        8715
dechets         3330
consommation    2765
bio             2660
tri             2455
locaux          2191
voiture         2007
eau             1699
transports      1401
acheter         1395
Name: produits, dtype: uint16

consommation


consommation    8619
dechets         3100
produits        2765
tri             2516
eau             2366
bio             1894
voiture         1857
viande          1695
chauffage       1384
energie         1363
Name: consommation, dtype: uint16

eau


eau             6724
dechets         2747
consommation    2366
tri             2272
electricite     1803
produits        1699
voiture         1602
chauffage       1494
bio             1180
utilisation     1014
Name: eau, dtype: uint16

bio


bio             6393
produits        2660
dechets         2450
consommation    1894
tri             1707
voiture         1593
local           1500
eau             1180
viande          1169
velo            1084
Name: bio, dtype: uint16

chauffage


chauffage       5567
dechets         2030
tri             1865
voiture         1546
eau             1494
consommation    1384
produits        1137
bio              911
maison           861
deplacements     844
Name: chauffage, dtype: uint16

transports


transports      5463
commun          4038
dechets         1903
tri             1528
produits        1401
voiture         1376
consommation    1298
utilisation     1255
velo            1048
bio              988
Name: transports, dtype: uint16

velo


velo            5309
dechets         1742
voiture         1494
tri             1249
produits        1195
commun          1133
consommation    1116
deplacements    1107
bio             1084
transports      1048
Name: velo, dtype: uint16

commun


commun          5137
transports      4038
dechets         1798
tri             1472
voiture         1328
produits        1289
consommation    1185
transport       1175
utilisation     1141
velo            1133
Name: commun, dtype: uint16

selectif


selectif        5132
tri             4971
consommation    1016
voiture          991
produits         949
eau              929
dechets          880
chauffage        767
utilisation      735
transports       657
Name: selectif, dtype: uint16

deplacements


deplacements    4563
dechets         1672
voiture         1608
tri             1301
consommation    1235
velo            1107
produits        1089
chauffage        844
eau              830
limiter          768
Name: deplacements, dtype: uint16

utilisation


utilisation     4326
tri             1879
dechets         1780
produits        1366
transports      1255
voiture         1246
commun          1141
consommation    1140
eau             1014
chauffage        820
Name: utilisation, dtype: uint16

faire


faire           4023
dechets         1450
voiture         1082
tri             1024
produits        1022
eau              909
consommation     898
bio              729
velo             619
acheter          603
Name: faire, dtype: uint16

energie


energie         3615
consommation    1363
dechets         1328
tri             1063
eau              939
produits         785
voiture          666
economie         582
bio              567
chauffage        548
Name: energie, dtype: uint16

maison


maison          3481
dechets         1259
voiture         1077
produits         974
isolation        882
tri              875
eau              874
chauffage        861
consommation     773
bio              771
Name: maison, dtype: uint16

local


local           3388
bio             1500
dechets         1221
produits         876
voiture          847
consommer        841
consommation     798
acheter          727
achete           664
tri              611
Name: local, dtype: uint16

viande


viande          3274
consommation    1695
produits        1225
dechets         1172
bio             1169
voiture          938
tri              691
mange            676
velo             655
eau              619
Name: viande, dtype: uint16

trie


trie            3168
dechets         2453
voiture          849
produits         777
utilise          695
achete           655
eau              644
bio              633
consommation     538
commun           442
Name: trie, dtype: uint16

In [45]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_6[i].sort_values(ascending=False).head(10))

dechets


dechets      1.000000
trier        0.795552
ramassage    0.781690
trie         0.774306
verts        0.754658
ramasse      0.747692
vegetaux     0.685606
gestion      0.675393
menagers     0.659062
composte     0.625641
Name: dechets, dtype: float32

tri


tri           1.000000
selectif      0.968628
menageres     0.656028
ordures       0.614424
respect       0.538265
compostage    0.524862
ramassage     0.503521
economie      0.494737
limitation    0.469981
poubelles     0.463796
Name: tri, dtype: float32

voiture


voiture      1.000000
polluante    0.675182
hybride      0.547619
petite       0.539823
prendre      0.479670
trajets      0.466296
essence      0.462887
lieu         0.445693
train        0.445600
bus          0.441860
Name: voiture, dtype: float32

produits


produits       1.000000
emballes       0.920266
transformes    0.901060
issus          0.870370
chimiques      0.831625
locaux         0.795281
naturels       0.752998
huile          0.664151
respectueux    0.660920
entretien      0.657420
Name: produits, dtype: float32

consommation


consommation    1.000000
basse           0.810976
biens           0.591772
locale          0.581502
raisonnee       0.571200
viande          0.517715
energetique     0.517241
reduit          0.516199
diminution      0.514443
faible          0.513433
Name: consommation, dtype: float32

eau


eau             1.000000
chaude          0.984710
pluie           0.889117
recupere        0.787645
economise       0.735714
arrosage        0.703704
recuperation    0.693878
douche          0.650873
economiser      0.609428
electricite     0.601602
Name: eau, dtype: float32

bio


bio             1.000000
mange           0.534918
manger          0.501621
preference      0.483986
local           0.442739
fournisseur     0.429630
alimentation    0.423717
vrac            0.413824
transformes     0.413428
poisson         0.403509
Name: bio, dtype: float32

chauffage


chauffage    1.000000
19           0.537415
nuit         0.532258
baisse       0.512456
bois         0.508350
eclairage    0.498246
granules     0.472222
chaude       0.458716
18           0.437700
systeme      0.414634
Name: chauffage, dtype: float32

transports


transports     1.000000
communs        0.914607
commun         0.786062
publics        0.565079
prends         0.377633
privilegier    0.336798
prendre        0.311538
marche         0.302326
privilegie     0.291956
utilisation    0.290106
Name: transports, dtype: float32

velo


velo           1.000000
deplace        0.566017
pieds          0.432532
trajet         0.432432
pied           0.425847
deplacement    0.416096
distances      0.409794
travail        0.409639
deplacer       0.409346
bus            0.406977
Name: velo, dtype: float32

commun


commun         1.000000
transports     0.739154
transport      0.608493
prends         0.339869
marche         0.292050
privilegier    0.282744
prendre        0.276374
ville          0.275680
utilisation    0.263754
privilegie     0.260179
Name: commun, dtype: float32

selectif


selectif        1.000000
tri             0.408598
pratique        0.311909
respect         0.266582
compostage      0.211326
economie        0.205614
conduite        0.195822
recuperation    0.186395
limitation      0.183990
utilisation     0.169903
Name: selectif, dtype: float32

deplacements


deplacements    1.000000
limite          0.340633
quotidiens      0.336957
inutiles        0.334342
limiter         0.310052
limitation      0.298257
pieds           0.256932
pied            0.243114
avion           0.235547
reduis          0.224359
Name: deplacements, dtype: float32

utilisation


utilisation    1.000000
raisonnee      0.280000
diminution     0.266850
limitation     0.252421
reduction      0.241928
chimiques      0.241581
pesticides     0.241158
transports     0.229727
menagers       0.229404
commun         0.222114
Name: utilisation, dtype: float32

faire


faire       1.000000
chose       0.392045
courses     0.349070
choses      0.322148
faut        0.315522
aimerais    0.307479
reparer     0.293103
temps       0.290441
pouvoir     0.290435
grand       0.286932
Name: faire, dtype: float32

energie


energie          1.000000
renouvelable     0.695364
economies        0.500000
fournisseur      0.425926
economie         0.408421
verte            0.364912
economiser       0.328283
consommations    0.234899
solaire          0.209055
production       0.202999
Name: energie, dtype: float32

maison


maison       1.000000
isolee       0.949416
isoler       0.473684
isole        0.453094
poele        0.342790
travaux      0.332353
18           0.329073
isolation    0.327394
bois         0.281897
panneaux     0.265810
Name: maison, dtype: float32

local


local        1.000000
manger       0.316856
consommer    0.309191
mange        0.285290
consomme     0.284427
acheter      0.244616
saison       0.242718
occasion     0.240048
bio          0.234632
achete       0.233968
Name: local, dtype: float32

viande


viande     1.000000
poisson    0.912281
mange      0.502229
semaine    0.481390
manger     0.411669
reduit     0.347732
issus      0.327161
qualite    0.283505
reduis     0.266026
fruits     0.252014
Name: viande, dtype: float32

trie


trie         1.000000
economise    0.330952
jette        0.314587
composte     0.296154
roule        0.240244
achete       0.230796
mange        0.226597
evite        0.226532
utilise      0.222329
chauffe      0.217749
Name: trie, dtype: float32

In [46]:
for i in df_qu_6_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_6[i].sort_values(ascending=False).head(10))

dechets


dechets      0.000072
trier        0.000057
ramassage    0.000056
trie         0.000055
verts        0.000054
ramasse      0.000054
vegetaux     0.000049
gestion      0.000048
menagers     0.000047
composte     0.000045
Name: dechets, dtype: float32

tri


tri           0.000082
selectif      0.000080
menageres     0.000054
ordures       0.000051
respect       0.000044
compostage    0.000043
ramassage     0.000041
economie      0.000041
limitation    0.000039
poubelles     0.000038
Name: tri, dtype: float32

voiture


voiture      0.000112
polluante    0.000075
hybride      0.000061
petite       0.000060
prendre      0.000054
trajets      0.000052
essence      0.000052
lieu         0.000050
train        0.000050
bus          0.000049
Name: voiture, dtype: float32

produits


produits       0.000115
emballes       0.000106
transformes    0.000103
issus          0.000100
chimiques      0.000095
locaux         0.000091
naturels       0.000086
huile          0.000076
respectueux    0.000076
entretien      0.000075
Name: produits, dtype: float32

consommation


consommation    0.000116
basse           0.000094
biens           0.000069
locale          0.000067
raisonnee       0.000066
viande          0.000060
energetique     0.000060
reduit          0.000060
diminution      0.000060
faible          0.000060
Name: consommation, dtype: float32

eau


eau             0.000149
chaude          0.000146
pluie           0.000132
recupere        0.000117
economise       0.000109
arrosage        0.000105
recuperation    0.000103
douche          0.000097
economiser      0.000091
electricite     0.000089
Name: eau, dtype: float32

bio


bio             0.000156
mange           0.000084
manger          0.000078
preference      0.000076
local           0.000069
fournisseur     0.000067
alimentation    0.000066
vrac            0.000065
transformes     0.000065
poisson         0.000063
Name: bio, dtype: float32

chauffage


chauffage    0.000180
19           0.000097
nuit         0.000096
baisse       0.000092
bois         0.000091
eclairage    0.000089
granules     0.000085
chaude       0.000082
18           0.000079
systeme      0.000074
Name: chauffage, dtype: float32

transports


transports     0.000183
communs        0.000167
commun         0.000144
publics        0.000103
prends         0.000069
privilegier    0.000062
prendre        0.000057
marche         0.000055
privilegie     0.000053
utilisation    0.000053
Name: transports, dtype: float32

velo


velo           0.000188
deplace        0.000107
pieds          0.000081
trajet         0.000081
pied           0.000080
deplacement    0.000078
distances      0.000077
travail        0.000077
deplacer       0.000077
bus            0.000077
Name: velo, dtype: float32

commun


commun         0.000195
transports     0.000144
transport      0.000118
prends         0.000066
marche         0.000057
privilegier    0.000055
prendre        0.000054
ville          0.000054
utilisation    0.000051
privilegie     0.000051
Name: commun, dtype: float32

selectif


selectif        0.000195
tri             0.000080
pratique        0.000061
respect         0.000052
compostage      0.000041
economie        0.000040
conduite        0.000038
recuperation    0.000036
limitation      0.000036
utilisation     0.000033
Name: selectif, dtype: float32

deplacements


deplacements    0.000219
limite          0.000075
quotidiens      0.000074
inutiles        0.000073
limiter         0.000068
limitation      0.000065
pieds           0.000056
pied            0.000053
avion           0.000052
reduis          0.000049
Name: deplacements, dtype: float32

utilisation


utilisation    0.000231
raisonnee      0.000065
diminution     0.000062
limitation     0.000058
reduction      0.000056
chimiques      0.000056
pesticides     0.000056
transports     0.000053
menagers       0.000053
commun         0.000051
Name: utilisation, dtype: float32

faire


faire       0.000249
chose       0.000097
courses     0.000087
choses      0.000080
faut        0.000078
aimerais    0.000076
reparer     0.000073
temps       0.000072
pouvoir     0.000072
grand       0.000071
Name: faire, dtype: float32

energie


energie          0.000277
renouvelable     0.000192
economies        0.000138
fournisseur      0.000118
economie         0.000113
verte            0.000101
economiser       0.000091
consommations    0.000065
solaire          0.000058
production       0.000056
Name: energie, dtype: float32

maison


maison       0.000287
isolee       0.000273
isoler       0.000136
isole        0.000130
poele        0.000098
travaux      0.000095
18           0.000095
isolation    0.000094
bois         0.000081
panneaux     0.000076
Name: maison, dtype: float32

local


local        0.000295
manger       0.000094
consommer    0.000091
mange        0.000084
consomme     0.000084
acheter      0.000072
saison       0.000072
occasion     0.000071
bio          0.000069
achete       0.000069
Name: local, dtype: float32

viande


viande     0.000305
poisson    0.000279
mange      0.000153
semaine    0.000147
manger     0.000126
reduit     0.000106
issus      0.000100
qualite    0.000087
reduis     0.000081
fruits     0.000077
Name: viande, dtype: float32

trie


trie         0.000316
economise    0.000104
jette        0.000099
composte     0.000093
roule        0.000076
achete       0.000073
mange        0.000072
evite        0.000072
utilise      0.000070
chauffe      0.000069
Name: trie, dtype: float32

In [47]:
gc.collect()

105

# Question 7 : Qu'est-ce qui pourrait vous inciter à changer vos comportements comme par exemple mieux entretenir et régler votre chauffage, modifier votre manière de conduire ou renoncer à prendre votre véhicule pour de très petites distances ?

In [48]:
question_7 = "Qu'est-ce qui pourrait vous inciter à changer vos comportements comme par exemple mieux entretenir et régler votre chauffage, modifier votre manière de conduire ou renoncer à prendre votre véhicule pour de très petites distances ?"
qu_7,df_qu_7_one_hot,df_cov_7,df_confidence_7,df_lift_7 = compute_similarities(question_7, new_res)

In [49]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_7[i].sort_values(ascending=False).head(10))

transports


transports    7063
commun        4463
voiture       1224
chauffage      909
communs        722
developper     683
cyclables      639
bus            622
vehicule       617
prendre        614
Name: transports, dtype: uint16

commun


commun        5907
transports    4463
transport     1681
voiture       1116
chauffage      794
vehicule       572
prendre        545
developper     541
faire          528
cyclables      519
Name: commun, dtype: uint16

voiture


voiture       4951
transports    1224
chauffage     1179
commun        1116
prendre        965
electrique     849
faire          842
transport      665
velo           633
tout           575
Name: voiture, dtype: uint16

chauffage


chauffage     4845
voiture       1179
transports     909
commun         794
vehicule       776
faire          716
isolation      634
electrique     602
changer        539
transport      471
Name: chauffage, dtype: uint16

faire


faire         3923
voiture        842
chauffage      716
tout           646
faut           629
transports     598
commun         528
prendre        454
vehicule       435
velo           419
Name: faire, dtype: uint16

vehicule


vehicule      3056
chauffage      776
prendre        673
electrique     638
transports     617
commun         572
renoncer       476
faire          435
distances      395
voiture        379
Name: vehicule, dtype: uint16

tout


tout          3050
faire          646
voiture        575
monde          475
chauffage      445
transports     444
faut           434
commun         363
exemple        287
vehicule       284
Name: tout, dtype: uint16

transport


transport     2941
commun        1681
voiture        665
transports     488
chauffage      471
vehicule       317
faire          309
bus            295
velo           285
prendre        270
Name: transport, dtype: uint16

velo


velo          2612
voiture        633
electrique     617
pistes         560
cyclables      558
transports     541
commun         486
chauffage      459
faire          419
prendre        353
Name: velo, dtype: uint16

faut


faut          2369
faire          629
voiture        554
transports     485
tout           434
chauffage      425
commun         394
changer        302
prendre        301
exemple        290
Name: faut, dtype: uint16

electrique


electrique    2292
voiture        849
vehicule       638
velo           617
chauffage      602
transports     344
achat          319
commun         309
tout           274
faire          271
Name: electrique, dtype: uint16

aides


aides          2291
financieres     481
transports      464
chauffage       458
isolation       399
commun          346
voiture         298
changer         290
faire           247
vehicule        213
Name: aides, dtype: uint16

prix


prix          2202
transports     561
commun         482
voiture        373
chauffage      306
faire          285
transport      241
vehicules      238
electrique     236
vehicule       232
Name: prix, dtype: uint16

prendre


prendre       2155
voiture        965
vehicule       673
transports     614
commun         545
faire          454
chauffage      418
renoncer       378
velo           353
faut           301
Name: prendre, dtype: uint16

cyclables


cyclables     2109
pistes        1879
transports     639
velo           558
commun         519
voiture        297
securisees     286
developper     279
ville          265
chauffage      246
Name: cyclables, dtype: uint16

exemple


exemple       2042
transports     426
faire          409
voiture        358
commun         331
faut           290
tout           287
chauffage      271
tous           219
prendre        205
Name: exemple, dtype: uint16

pistes


pistes        2017
cyclables     1879
transports     612
velo           560
commun         507
voiture        279
securisees     275
developper     270
ville          262
chauffage      240
Name: pistes, dtype: uint16

changer


changer         2008
chauffage        539
voiture          395
faire            362
chaudiere        334
vehicule         312
faut             302
aides            290
comportement     287
transports       285
Name: changer, dtype: uint16

tous


tous          1877
transports     388
faire          372
voiture        338
chauffage      306
commun         292
faut           273
tout           266
exemple        219
prix           195
Name: tous, dtype: uint16

isolation


isolation     1795
chauffage      634
transports     427
aides          399
commun         328
voiture        310
travaux        288
aide           274
faire          258
maison         228
Name: isolation, dtype: uint16

In [50]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_7[i].sort_values(ascending=False).head(10))

transports


transports    1.000000
communs       0.912769
frequents     0.795699
gratuits      0.793515
gratuite      0.788851
commun        0.755544
collectifs    0.752711
frequence     0.692015
publics       0.645833
adaptes       0.637874
Name: transports, dtype: float32

commun


commun        1.000000
transports    0.631884
gratuite      0.587838
transport     0.571574
frequents     0.555556
frequence     0.520913
horaires      0.488753
gratuits      0.481229
reseau        0.460882
adaptes       0.448505
Name: commun, dtype: float32

voiture


voiture          1.000000
indispensable    0.626712
prends           0.483471
impossible       0.467290
courses          0.456876
habitant         0.452575
travailler       0.449239
prendre          0.447796
oblige           0.442688
petite           0.436137
Name: voiture, dtype: float32

chauffage


chauffage       1.000000
regler          0.779851
regle           0.768421
locataire       0.536965
bois            0.529412
mode            0.511905
proprietaire    0.500000
temperature     0.494297
collectif       0.473461
pompe           0.452991
Name: chauffage, dtype: float32

faire


faire         1.000000
courses       0.578089
economies     0.384615
efforts       0.368224
chose         0.365854
payer         0.356568
choses        0.353591
effort        0.340694
arreter       0.305825
travailler    0.284264
Name: faire, dtype: float32

vehicule


vehicule      1.000000
renoncer      0.644114
hybride       0.542424
polluant      0.430421
diesel        0.391732
distances     0.350488
prendre       0.312297
propre        0.306867
utilise       0.305331
impossible    0.289720
Name: vehicule, dtype: float32

tout


tout        1.000000
monde       0.617685
vie         0.187911
faut        0.183200
citoyens    0.181395
probleme    0.175325
temps       0.173010
faire       0.164670
cas         0.163892
sens        0.163690
Name: tout, dtype: float32

transport


transport    1.000000
gratuit      0.419598
public       0.394595
reseau       0.358464
aucun        0.336207
collectif    0.299363
moyen        0.295858
offre        0.287619
commun       0.284578
horaires     0.257669
Name: transport, dtype: float32

velo


velo          1.000000
securite      0.370180
pied          0.369906
cyclable      0.343234
voies         0.331818
securisees    0.301449
routes        0.294264
pistes        0.277640
electrique    0.269197
cyclables     0.264580
Name: velo, dtype: float32

faut


faut        1.000000
arreter     0.296117
citoyens    0.209302
solution    0.192171
inciter     0.190311
mettre      0.188679
vie         0.166886
monde       0.165150
aller       0.163810
faire       0.160336
Name: faut, dtype: float32

electrique


electrique     1.000000
hybride        0.430303
acheter        0.350649
achat          0.328866
diesel         0.289370
essence        0.242991
velo           0.236217
vehicule       0.208770
electricite    0.179792
passer         0.174716
Name: electrique, dtype: float32

aides


aides          1.000000
financieres    0.578821
revenus        0.339450
travaux        0.242057
isoler         0.234568
energetique    0.229787
isolation      0.222284
transition     0.221739
logement       0.205202
changement     0.150766
Name: aides, dtype: float32

prix


prix            1.000000
baisser         0.430993
augmentation    0.365116
baisse          0.323630
augmenter       0.277003
produits        0.223291
essence         0.222430
electricite     0.175334
vehicules       0.167724
electriques     0.166376
Name: prix, dtype: float32

prendre


prendre      1.000000
renoncer     0.511502
oblige       0.403162
eviter       0.317757
distances    0.252884
aller        0.240952
courses      0.240093
vehicule     0.220223
petites      0.218657
voiture      0.194910
Name: prendre, dtype: float32

cyclables


cyclables        1.000000
pistes           0.931582
securisees       0.828986
voies            0.425000
routes           0.321696
velos            0.297554
velo             0.213629
reseau           0.210526
developper       0.206973
developpement    0.204819
Name: cyclables, dtype: float32

exemple


exemple        1.000000
entreprises    0.192632
citoyens       0.159690
produits       0.131410
voitures       0.126417
faut           0.122415
train          0.121364
place          0.121164
inciter        0.118800
tous           0.116676
Name: exemple, dtype: float32

pistes


pistes           1.000000
cyclables        0.890944
securisees       0.797101
velos            0.292120
routes           0.264339
velo             0.214395
reseau           0.200569
developper       0.200297
developpement    0.190918
villes           0.183566
Name: pistes, dtype: float32

changer


changer          1.000000
fenetres         0.307479
comportement     0.274904
chaudiere        0.252839
mode             0.244048
comportements    0.243682
diesel           0.232283
inciter          0.204152
ans              0.162416
moyens           0.145974
Name: changer, dtype: float32

tous


tous            1.000000
jours           0.604895
ans             0.225503
produits        0.175214
citoyens        0.168992
information     0.139946
monde           0.139142
consommation    0.133779
entreprises     0.123158
mettre          0.123138
Name: tous, dtype: float32

isolation


isolation    1.000000
thermique    0.469965
travaux      0.435703
logements    0.360920
fenetres     0.318560
logement     0.264451
maison       0.213683
ameliorer    0.204108
meilleure    0.192604
aides        0.174160
Name: isolation, dtype: float32

In [51]:
for i in df_qu_7_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_7[i].sort_values(ascending=False).head(10))

transports


transports    0.000142
communs       0.000129
frequents     0.000113
gratuits      0.000112
gratuite      0.000112
commun        0.000107
collectifs    0.000107
frequence     0.000098
publics       0.000091
adaptes       0.000090
Name: transports, dtype: float32

commun


commun        0.000169
transports    0.000107
gratuite      0.000100
transport     0.000097
frequents     0.000094
frequence     0.000088
horaires      0.000083
gratuits      0.000081
reseau        0.000078
adaptes       0.000076
Name: commun, dtype: float32

voiture


voiture          0.000202
indispensable    0.000127
prends           0.000098
impossible       0.000094
courses          0.000092
habitant         0.000091
travailler       0.000091
prendre          0.000090
oblige           0.000089
petite           0.000088
Name: voiture, dtype: float32

chauffage


chauffage       0.000206
regler          0.000161
regle           0.000159
locataire       0.000111
bois            0.000109
mode            0.000106
proprietaire    0.000103
temperature     0.000102
collectif       0.000098
pompe           0.000093
Name: chauffage, dtype: float32

faire


faire         0.000255
courses       0.000147
economies     0.000098
efforts       0.000094
chose         0.000093
payer         0.000091
choses        0.000090
effort        0.000087
arreter       0.000078
travailler    0.000072
Name: faire, dtype: float32

vehicule


vehicule      0.000327
renoncer      0.000211
hybride       0.000177
polluant      0.000141
diesel        0.000128
distances     0.000115
prendre       0.000102
propre        0.000100
utilise       0.000100
impossible    0.000095
Name: vehicule, dtype: float32

tout


tout        0.000328
monde       0.000203
vie         0.000062
faut        0.000060
citoyens    0.000059
probleme    0.000057
temps       0.000057
faire       0.000054
cas         0.000054
sens        0.000054
Name: tout, dtype: float32

transport


transport    0.000340
gratuit      0.000143
public       0.000134
reseau       0.000122
aucun        0.000114
collectif    0.000102
moyen        0.000101
offre        0.000098
commun       0.000097
horaires     0.000088
Name: transport, dtype: float32

velo


velo          0.000383
securite      0.000142
pied          0.000142
cyclable      0.000131
voies         0.000127
securisees    0.000115
routes        0.000113
pistes        0.000106
electrique    0.000103
cyclables     0.000101
Name: velo, dtype: float32

faut


faut        0.000422
arreter     0.000125
citoyens    0.000088
solution    0.000081
inciter     0.000080
mettre      0.000080
vie         0.000070
monde       0.000070
aller       0.000069
faire       0.000068
Name: faut, dtype: float32

electrique


electrique     0.000436
hybride        0.000188
acheter        0.000153
achat          0.000143
diesel         0.000126
essence        0.000106
velo           0.000103
vehicule       0.000091
electricite    0.000078
passer         0.000076
Name: electrique, dtype: float32

aides


aides          0.000436
financieres    0.000253
revenus        0.000148
travaux        0.000106
isoler         0.000102
energetique    0.000100
isolation      0.000097
transition     0.000097
logement       0.000090
changement     0.000066
Name: aides, dtype: float32

prix


prix            0.000454
baisser         0.000196
augmentation    0.000166
baisse          0.000147
augmenter       0.000126
produits        0.000101
essence         0.000101
electricite     0.000080
vehicules       0.000076
electriques     0.000076
Name: prix, dtype: float32

prendre


prendre      0.000464
renoncer     0.000237
oblige       0.000187
eviter       0.000147
distances    0.000117
aller        0.000112
courses      0.000111
vehicule     0.000102
petites      0.000101
voiture      0.000090
Name: prendre, dtype: float32

cyclables


cyclables        0.000474
pistes           0.000442
securisees       0.000393
voies            0.000202
routes           0.000153
velos            0.000141
velo             0.000101
reseau           0.000100
developper       0.000098
developpement    0.000097
Name: cyclables, dtype: float32

exemple


exemple        0.000490
entreprises    0.000094
citoyens       0.000078
produits       0.000064
voitures       0.000062
faut           0.000060
train          0.000059
place          0.000059
inciter        0.000058
tous           0.000057
Name: exemple, dtype: float32

pistes


pistes           0.000496
cyclables        0.000442
securisees       0.000395
velos            0.000145
routes           0.000131
velo             0.000106
reseau           0.000099
developper       0.000099
developpement    0.000095
villes           0.000091
Name: pistes, dtype: float32

changer


changer          0.000498
fenetres         0.000153
comportement     0.000137
chaudiere        0.000126
mode             0.000122
comportements    0.000121
diesel           0.000116
inciter          0.000102
ans              0.000081
moyens           0.000073
Name: changer, dtype: float32

tous


tous            0.000533
jours           0.000322
ans             0.000120
produits        0.000093
citoyens        0.000090
information     0.000075
monde           0.000074
consommation    0.000071
entreprises     0.000066
mettre          0.000066
Name: tous, dtype: float32

isolation


isolation    0.000557
thermique    0.000262
travaux      0.000243
logements    0.000201
fenetres     0.000177
logement     0.000147
maison       0.000119
ameliorer    0.000114
meilleure    0.000107
aides        0.000097
Name: isolation, dtype: float32

In [52]:
gc.collect()

105

# Question 8 : Quelles seraient pour vous les solutions les plus simples et les plus supportables sur un plan financier pour vous inciter à changer vos comportements ?

In [53]:
question_8 = "Quelles seraient pour vous les solutions les plus simples et les plus supportables sur un plan financier pour vous inciter à changer vos comportements ?"
qu_8,df_qu_8_one_hot,df_cov_8,df_confidence_8,df_lift_8 = compute_similarities(question_8, new_res)

In [54]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_8[i].sort_values(ascending=False).head(10))

transports


transports    3705
commun        2249
gratuite       469
prix           450
voiture        402
developper     392
gratuits       316
communs        316
publics        304
produits       274
Name: transports, dtype: uint16

faire


faire       3138
faut         474
tout         464
changer      384
prix         343
voiture      339
exemple      333
payer        331
tous         302
produits     298
Name: faire, dtype: uint16

produits


produits         3063
tva               624
bio               606
prix              548
taxer             466
non               354
taxes             350
environnement     345
locaux            329
tous              316
Name: produits, dtype: uint16

prix


prix           2936
produits        548
transports      450
baisser         404
vehicules       367
commun          357
faire           343
voiture         326
electriques     307
baisse          297
Name: prix, dtype: uint16

commun


commun        2936
transports    2249
transport      772
prix           357
gratuite       344
voiture        337
developper     321
faire          211
villes         201
produits       192
Name: commun, dtype: uint16

aides


aides          2665
financieres     435
isolation       380
faire           273
chauffage       267
changer         236
prix            228
voiture         208
travaux         206
aide            203
Name: aides, dtype: uint16

voiture


voiture       2377
electrique     685
transports     402
changer        351
faire          339
commun         337
prix           326
tout           267
achat          259
faut           255
Name: voiture, dtype: uint16

tout


tout        2218
faire        464
monde        460
faut         363
voiture      267
changer      256
prix         246
exemple      237
produits     229
tous         220
Name: tout, dtype: uint16

aide


aide          2159
financiere     431
achat          344
vehicule       316
isolation      312
electrique     298
voiture        218
changer        213
aides          203
chauffage      202
Name: aide, dtype: uint16

changer


changer          2143
comportement      511
comportements     402
faire             384
voiture           351
faut              350
tout              256
vehicule          251
aides             236
aide              213
Name: changer, dtype: uint16

exemple


exemple       1950
faire          333
produits       250
voiture        250
tout           237
faut           231
transports     226
prix           226
tous           198
changer        192
Name: exemple, dtype: uint16

faut


faut           1893
faire           474
tout            363
changer         350
voiture         255
exemple         231
prix            218
produits        218
tous            206
entreprises     182
Name: faut, dtype: uint16

electrique


electrique    1830
voiture        685
vehicule       570
achat          416
velo           307
aide           298
prix           293
vehicules      251
tout           204
faire          200
Name: electrique, dtype: uint16

tous


tous          1800
produits       316
faire          302
tout           220
prix           211
faut           206
aides          200
transports     200
exemple        198
voiture        182
Name: tous, dtype: uint16

non


non           1663
produits       354
faire          231
prix           199
tout           190
faut           180
voiture        169
transports     168
tous           167
aides          163
Name: non, dtype: uint16

transport


transport     1633
commun         772
transports     233
voiture        219
prix           190
produits       172
gratuit        150
faire          150
exemple        138
cout           136
Name: transport, dtype: uint16

ecologique


ecologique    1627
transition     508
produits       296
faire          245
tout           216
voiture        185
exemple        173
taxe           171
prix           165
faut           164
Name: ecologique, dtype: uint16

vehicule


vehicule      1620
electrique     570
achat          424
aide           316
changer        251
prix           227
vehicules      224
propre         216
diesel         189
aides          187
Name: vehicule, dtype: uint16

vehicules


vehicules      1599
electriques     487
prix            367
electrique      251
achat           248
vehicule        224
polluants       224
propres         221
transports      192
aides           183
Name: vehicules, dtype: uint16

taxes


taxes        1595
produits      350
impots        164
faire         151
tout          148
augmenter     148
baisser       146
prix          145
exemple       144
tous          143
Name: taxes, dtype: uint16

In [55]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_8[i].sort_values(ascending=False).head(10))

transports


transports    1.000000
communs       0.908046
commun        0.766008
gratuits      0.747045
gratuite      0.714939
collectifs    0.640741
publics       0.590291
trains        0.402827
bus           0.392581
villes        0.370940
Name: transports, dtype: float32

faire


faire        1.000000
economies    0.384127
efforts      0.376884
payer        0.364136
effort       0.343750
choix        0.281623
gros         0.270455
planete      0.261538
mieux        0.257745
aller        0.254274
Name: faire, dtype: float32

produits


produits        1.000000
locaux          0.627863
bio             0.554437
responsables    0.498403
tva             0.485981
polluants       0.440407
emballages      0.399217
produit         0.369128
plastique       0.342105
impact          0.341667
Name: produits, dtype: float32

prix


prix            1.000000
baisser         0.442497
baisse          0.346558
augmentation    0.288636
augmenter       0.280363
electriques     0.274107
essence         0.271044
offre           0.250591
diminuer        0.245509
bio             0.241537
Name: prix, dtype: float32

commun


commun        1.000000
transports    0.607018
gratuite      0.524390
transport     0.472750
gratuit       0.449612
gratuits      0.427896
reseau        0.384615
villes        0.343590
cyclables     0.295720
bus           0.292117
Name: commun, dtype: float32

aides


aides          1.000000
financieres    0.562016
fiscales       0.297071
isoler         0.296296
revenus        0.276094
travaux        0.262420
isolation      0.243278
chaudiere      0.215812
maison         0.191228
chauffage      0.189227
Name: aides, dtype: float32

voiture


voiture         1.000000
electrique      0.374317
hybride         0.363057
prendre         0.303311
diesel          0.299658
aller           0.294872
acheter         0.275561
essence         0.260943
deplacements    0.243304
utiliser        0.229862
Name: voiture, dtype: float32

tout


tout        1.000000
monde       0.662824
argent      0.210275
temps       0.205212
faut        0.191759
vie         0.189873
arreter     0.188198
faudrait    0.164918
ecologie    0.163200
solution    0.158629
Name: tout, dtype: float32

aide


aide          1.000000
financiere    0.464941
achat         0.224543
isolation     0.199744
vehicule      0.195062
velo          0.172377
electrique    0.162842
travaux       0.154140
chauffage     0.143161
changement    0.141799
Name: aide, dtype: float32

changer


changer          1.000000
comportement     0.387709
comportements    0.340389
chaudiere        0.326923
mode             0.244770
diesel           0.193493
faut             0.184892
besoin           0.180624
inciter          0.174011
moyens           0.159700
Name: changer, dtype: float32

exemple


exemple          1.000000
prendre          0.156291
dechets          0.132919
entreprises      0.132601
inciter          0.131073
faut             0.122029
tous             0.110000
place            0.109827
mettre           0.109428
environnement    0.107239
Name: exemple, dtype: float32

faut


faut        1.000000
arreter     0.236045
monde       0.190202
citoyens    0.175839
ecologie    0.174400
inciter     0.170621
argent      0.169654
tout        0.163661
changer     0.163322
france      0.162367
Name: faut, dtype: float32

electrique


electrique    1.000000
hybride       0.535032
vehicule      0.351852
hydrogene     0.347826
velo          0.328694
voiture       0.288178
diesel        0.272260
achat         0.271540
essence       0.235690
acheter       0.234414
Name: electrique, dtype: float32

tous


tous             1.000000
ans              0.188870
citoyens         0.161074
environnement    0.109026
faut             0.108822
produits         0.103167
exemple          0.101538
mettre           0.101010
non              0.100421
tout             0.099188
Name: tous, dtype: float32

non


non              1.000000
polluants        0.213663
produits         0.115573
bio              0.108875
taxer            0.105874
taxe             0.098170
entreprises      0.097436
voitures         0.096552
faut             0.095087
environnement    0.094727
Name: non, dtype: float32

transport


transport     1.000000
gratuit       0.387597
commun        0.262943
train         0.173454
moyens        0.144695
developper    0.115315
cout          0.103343
place         0.095789
voiture       0.092133
taxer         0.077186
Name: transport, dtype: float32

ecologique


ecologique     1.000000
transition     0.590698
fiscalite      0.277078
impact         0.256250
financer       0.194245
bonus          0.167752
taxe           0.142263
tva            0.123053
entreprises    0.112821
tout           0.097385
Name: ecologique, dtype: float32

vehicule


vehicule      1.000000
hybride       0.522293
propre        0.396330
polluant      0.394541
diesel        0.323630
electrique    0.311475
achat         0.276762
prime         0.240000
acheter       0.223192
essence       0.215488
Name: vehicule, dtype: float32

vehicules


vehicules        1.000000
electriques      0.434821
propres          0.399638
constructeurs    0.392491
hydrogene        0.326087
polluants        0.325581
diesel           0.210616
essence          0.171717
achat            0.161880
vehicule         0.138272
Name: vehicules, dtype: float32

taxes


taxes         1.000000
carburants    0.297688
augmenter     0.167991
baisser       0.159912
taxe          0.118968
transition    0.117442
impots        0.115412
produits      0.114267
taxer         0.082650
ecologique    0.082360
Name: taxes, dtype: float32

In [56]:
for i in df_qu_8_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_8[i].sort_values(ascending=False).head(10))

transports


transports    0.000270
communs       0.000245
commun        0.000207
gratuits      0.000202
gratuite      0.000193
collectifs    0.000173
publics       0.000159
trains        0.000109
bus           0.000106
villes        0.000100
Name: transports, dtype: float32

faire


faire        0.000319
economies    0.000122
efforts      0.000120
payer        0.000116
effort       0.000110
choix        0.000090
gros         0.000086
planete      0.000083
mieux        0.000082
aller        0.000081
Name: faire, dtype: float32

produits


produits        0.000326
locaux          0.000205
bio             0.000181
responsables    0.000163
tva             0.000159
polluants       0.000144
emballages      0.000130
produit         0.000121
plastique       0.000112
impact          0.000112
Name: produits, dtype: float32

prix


prix            0.000341
baisser         0.000151
baisse          0.000118
augmentation    0.000098
augmenter       0.000095
electriques     0.000093
essence         0.000092
offre           0.000085
diminuer        0.000084
bio             0.000082
Name: prix, dtype: float32

commun


commun        0.000341
transports    0.000207
gratuite      0.000179
transport     0.000161
gratuit       0.000153
gratuits      0.000146
reseau        0.000131
villes        0.000117
cyclables     0.000101
bus           0.000099
Name: commun, dtype: float32

aides


aides          0.000375
financieres    0.000211
fiscales       0.000111
isoler         0.000111
revenus        0.000104
travaux        0.000098
isolation      0.000091
chaudiere      0.000081
maison         0.000072
chauffage      0.000071
Name: aides, dtype: float32

voiture


voiture         0.000421
electrique      0.000157
hybride         0.000153
prendre         0.000128
diesel          0.000126
aller           0.000124
acheter         0.000116
essence         0.000110
deplacements    0.000102
utiliser        0.000097
Name: voiture, dtype: float32

tout


tout        0.000451
monde       0.000299
argent      0.000095
temps       0.000093
faut        0.000086
vie         0.000086
arreter     0.000085
faudrait    0.000074
ecologie    0.000074
solution    0.000072
Name: tout, dtype: float32

aide


aide          0.000463
financiere    0.000215
achat         0.000104
isolation     0.000093
vehicule      0.000090
velo          0.000080
electrique    0.000075
travaux       0.000071
chauffage     0.000066
changement    0.000066
Name: aide, dtype: float32

changer


changer          0.000467
comportement     0.000181
comportements    0.000159
chaudiere        0.000153
mode             0.000114
diesel           0.000090
faut             0.000086
besoin           0.000084
inciter          0.000081
moyens           0.000075
Name: changer, dtype: float32

exemple


exemple          0.000513
prendre          0.000080
dechets          0.000068
entreprises      0.000068
inciter          0.000067
faut             0.000063
tous             0.000056
place            0.000056
mettre           0.000056
environnement    0.000055
Name: exemple, dtype: float32

faut


faut        0.000528
arreter     0.000125
monde       0.000100
citoyens    0.000093
ecologie    0.000092
inciter     0.000090
argent      0.000090
tout        0.000086
changer     0.000086
france      0.000086
Name: faut, dtype: float32

electrique


electrique    0.000546
hybride       0.000292
vehicule      0.000192
hydrogene     0.000190
velo          0.000180
voiture       0.000157
diesel        0.000149
achat         0.000148
essence       0.000129
acheter       0.000128
Name: electrique, dtype: float32

tous


tous             0.000556
ans              0.000105
citoyens         0.000089
environnement    0.000061
faut             0.000060
produits         0.000057
exemple          0.000056
mettre           0.000056
non              0.000056
tout             0.000055
Name: tous, dtype: float32

non


non              0.000601
polluants        0.000128
produits         0.000069
bio              0.000065
taxer            0.000064
taxe             0.000059
entreprises      0.000059
voitures         0.000058
faut             0.000057
environnement    0.000057
Name: non, dtype: float32

transport


transport     0.000612
gratuit       0.000237
commun        0.000161
train         0.000106
moyens        0.000089
developper    0.000071
cout          0.000063
place         0.000059
voiture       0.000056
taxer         0.000047
Name: transport, dtype: float32

ecologique


ecologique     0.000615
transition     0.000363
fiscalite      0.000170
impact         0.000157
financer       0.000119
bonus          0.000103
taxe           0.000087
tva            0.000076
entreprises    0.000069
tout           0.000060
Name: ecologique, dtype: float32

vehicule


vehicule      0.000617
hybride       0.000322
propre        0.000245
polluant      0.000244
diesel        0.000200
electrique    0.000192
achat         0.000171
prime         0.000148
acheter       0.000138
essence       0.000133
Name: vehicule, dtype: float32

vehicules


vehicules        0.000625
electriques      0.000272
propres          0.000250
constructeurs    0.000245
hydrogene        0.000204
polluants        0.000204
diesel           0.000132
essence          0.000107
achat            0.000101
vehicule         0.000086
Name: vehicules, dtype: float32

taxes


taxes         0.000627
carburants    0.000187
augmenter     0.000105
baisser       0.000100
taxe          0.000075
transition    0.000074
impots        0.000072
produits      0.000072
taxer         0.000052
ecologique    0.000052
Name: taxes, dtype: float32

In [57]:
gc.collect()

126

# Question 9 :  Par rapport à votre mode de chauffage actuel, pensez-vous qu'il existe des solutions alternatives plus écologiques ?

In [59]:
question_9 = "Par rapport à votre mode de chauffage actuel, pensez-vous qu'il existe des solutions alternatives plus écologiques ?"
qu_9,df_qu_9_one_hot,df_cov_9,df_confidence_9,df_lift_9 = compute_similarities(question_9, new_res)

In [60]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_9[i].sort_values(ascending=False).head(10))

oui


oui    27145
non        0
Name: oui, dtype: uint16

non


non    18389
oui        0
Name: non, dtype: uint16

In [61]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_9[i].sort_values(ascending=False).head(10))

oui


oui    1.0
non    0.0
Name: oui, dtype: float32

non


non    1.0
oui    0.0
Name: non, dtype: float32

In [62]:
for i in df_qu_9_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_9[i].sort_values(ascending=False).head(10))

oui


oui    0.000037
non         NaN
Name: oui, dtype: float32

non


non    0.000054
oui         NaN
Name: non, dtype: float32

In [63]:
gc.collect()

14

# Question 10 :  Si oui, que faudrait-il faire pour vous convaincre ou vous aider à changer de mode de chauffage ?

In [64]:
question_10 = "Si oui, que faudrait-il faire pour vous convaincre ou vous aider à changer de mode de chauffage ?"
qu_10,df_qu_10_one_hot,df_cov_10,df_confidence_10,df_lift_10 = compute_similarities(question_10, new_res)

In [65]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_10[i].sort_values(ascending=False).head(10))

chauffage


chauffage     5666
mode          1506
changer        917
electrique     776
isolation      668
gaz            653
bois           583
ecologique     545
faire          505
aides          498
Name: chauffage, dtype: uint16

aide


aide            3202
financiere      1350
chauffage        452
chaudiere        312
installation     251
changer          245
chaleur          234
isolation        224
panneaux         217
pompe            192
Name: aide, dtype: uint16

aides


aides          2878
financieres     719
chauffage       498
isolation       274
changer         241
chaudiere       239
faire           218
mode            193
prix            179
chaleur         178
Name: aides, dtype: uint16

chaleur


chaleur         2170
pompe           1513
chauffage        478
pompes           422
chaudiere        311
gaz              277
aide             234
panneaux         232
solaire          206
installation     194
Name: chaleur, dtype: uint16

chaudiere


chaudiere       2043
gaz              635
changer          507
chauffage        372
condensation     345
aide             312
chaleur          311
pompe            269
fioul            243
aides            239
Name: chaudiere, dtype: uint16

panneaux


panneaux           2035
solaires           1541
installation        334
chauffage           333
photovoltaiques     282
installer           241
chaleur             232
solaire             230
aide                217
energie             175
Name: panneaux, dtype: uint16

isolation


isolation    1971
chauffage     668
aides         274
aide          224
travaux       219
mode          206
maison        205
faire         196
energie       195
faut          178
Name: isolation, dtype: uint16

faire


faire        1936
chauffage     505
travaux       245
faut          224
aides         218
changer       213
isolation     196
energie       193
chaudiere     189
tout          173
Name: faire, dtype: uint16

changer


changer      1927
chauffage     917
mode          527
chaudiere     507
gaz           251
aide          245
aides         241
faire         213
faut          190
moyens        169
Name: changer, dtype: uint16

solaire


solaire         1890
chauffage        439
energie          359
eau              241
panneaux         230
eolien           216
chaleur          206
installation     188
geothermie       175
chauffe          157
Name: solaire, dtype: uint16

gaz


gaz             1795
chauffage        653
chaudiere        635
chaleur          277
changer          251
bois             224
ville            221
electricite      211
pompe            206
condensation     184
Name: gaz, dtype: uint16

energie


energie        1761
chauffage       456
solaire         359
isolation       195
faire           193
electrique      184
electricite     176
faut            176
panneaux        175
gaz             174
Name: energie, dtype: uint16

solaires


solaires        1699
panneaux        1541
chauffage        286
installation     260
installer        197
chaleur          179
aide             175
energie          148
aides            142
faire            129
Name: solaires, dtype: uint16

financiere


financiere     1690
aide           1350
incitation      200
chauffage       187
changer         115
chaudiere       107
subventions       0
moyens            0
pompes            0
systeme           0
Name: financiere, dtype: uint16

mode


mode          1633
chauffage     1506
changer        527
ecologique     255
isolation      206
aides          193
faire          172
faut           172
changement     165
aide           159
Name: mode, dtype: uint16

pompe


pompe           1525
chaleur         1513
chauffage        343
chaudiere        269
gaz              206
aide             192
panneaux         157
solaire          147
installation     141
eau              132
Name: pompe, dtype: uint16

prix


prix           1482
chauffage       274
baisser         228
aides           179
faire           160
chaleur         159
electricite     146
gaz             143
chaudiere       136
aide            131
Name: prix, dtype: uint16

bois


bois           1387
chauffage       583
poele           291
chaudiere       238
gaz             224
chauffe         219
chaleur         178
electrique      167
granules        151
electricite     139
Name: bois, dtype: uint16

electrique


electrique     1305
chauffage       776
tout            247
electricite     194
nucleaire       189
energie         184
gaz             177
bois            167
chaleur         141
changer         139
Name: electrique, dtype: uint16

installation


installation    1273
panneaux         334
chauffage        274
solaires         260
aide             251
chaleur          194
solaire          188
cout             155
aides            154
pompe            141
Name: installation, dtype: uint16

In [66]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_10[i].sort_values(ascending=False).head(10))

chauffage


chauffage     1.000000
mode          0.922229
collectif     0.749147
modes         0.699597
electrique    0.594636
systeme       0.507772
type          0.487805
changer       0.475869
ecologique    0.461864
systemes      0.450382
Name: chauffage, dtype: float32

aide


aide            1.000000
financiere      0.798817
fiscale         0.301939
revenus         0.256790
financement     0.241176
changement      0.199317
installation    0.197172
achat           0.189435
chaudiere       0.152717
credit          0.151141
Name: aide, dtype: float32

aides


aides          1.000000
financieres    0.827388
fiscales       0.360825
revenus        0.323457
impots         0.190283
travaux        0.172892
changement     0.165148
tous           0.164557
moyens         0.142526
isolation      0.139016
Name: aides, dtype: float32

chaleur


chaleur         1.000000
pompe           0.992131
pompes          0.925439
eau             0.268562
installer       0.192308
gaz             0.154318
installation    0.152396
chaudiere       0.152227
ans             0.150219
geothermie      0.148189
Name: chaleur, dtype: float32

chaudiere


chaudiere       1.000000
condensation    0.907895
fuel            0.503979
fioul           0.486974
remplacer       0.402685
gaz             0.353760
granules        0.300860
changer         0.263103
changement      0.240319
ans             0.237939
Name: chaudiere, dtype: float32

panneaux


panneaux           1.000000
solaires           0.907004
photovoltaiques    0.836795
toit               0.583969
installer          0.370769
installation       0.262372
eau                0.208531
mettre             0.188347
exemple            0.161785
electricite        0.138103
Name: panneaux, dtype: float32

isolation


isolation        1.000000
ameliorer        0.474843
thermique        0.448571
meilleure        0.438547
batiments        0.380247
logements        0.319328
travaux          0.233725
proprietaires    0.195340
logement         0.187664
maison           0.167347
Name: isolation, dtype: float32

faire


faire            1.000000
travaux          0.261473
proprietaires    0.209677
mieux            0.208390
moyens           0.191194
faut             0.183607
pouvoir          0.174576
tout             0.157130
tous             0.151899
logement         0.145669
Name: faire, dtype: float32

changer


changer      1.000000
mode         0.322719
chaudiere    0.248164
fioul        0.240481
systeme      0.207254
moyens       0.195829
isoler       0.190000
ans          0.169956
chauffage    0.161843
faut         0.155738
Name: changer, dtype: float32

solaire


solaire         1.000000
eolien          0.703583
eau             0.380727
production      0.218107
chauffe         0.210738
energie         0.203861
geothermie      0.192097
installation    0.147683
electricite     0.122296
panneaux        0.113022
Name: solaire, dtype: float32

gaz


gaz             1.000000
ville           0.580052
condensation    0.484211
chaudiere       0.310817
fuel            0.270557
fioul           0.258517
actuellement    0.226457
chauffe         0.225503
electricite     0.175541
bois            0.161500
Name: gaz, dtype: float32

energie


energie         1.000000
renouvelable    0.633962
propre          0.415541
production      0.347737
nucleaire       0.310078
consommation    0.245211
solaire         0.189947
tous            0.147679
electricite     0.146423
faut            0.144262
Name: energie, dtype: float32

solaires


solaires        1.000000
panneaux        0.757248
toit            0.469466
installer       0.303077
installation    0.204242
eau             0.178515
mettre          0.153117
electricite     0.101498
maison          0.084898
energie         0.084043
Name: solaires, dtype: float32

financiere


financiere     1.000000
aide           0.421611
incitation     0.405680
changer        0.059678
chaudiere      0.052374
chauffage      0.033004
choix          0.000000
tva            0.000000
subventions    0.000000
terme          0.000000
Name: financiere, dtype: float32

mode


mode          1.000000
changer       0.273482
chauffage     0.265796
ecologique    0.216102
changement    0.187927
locataire     0.141463
faut          0.140984
faudrait      0.117542
isolation     0.104515
tout          0.099001
Name: mode, dtype: float32

pompe


pompe           1.000000
chaleur         0.697235
eau             0.208531
installer       0.166154
chaudiere       0.131669
ans             0.118421
gaz             0.114763
installation    0.110762
maison          0.103673
bois            0.087960
Name: pompe, dtype: float32

prix


prix            1.000000
baisser         0.470103
electricite     0.121464
installation    0.087981
faire           0.082645
gaz             0.079666
chaleur         0.073272
energie         0.072686
pompe           0.069508
chaudiere       0.066569
Name: prix, dtype: float32

bois


bois           1.000000
poele          0.515044
granules       0.432665
chauffe        0.293960
electrique     0.127969
gaz            0.124791
chaudiere      0.116495
electricite    0.115641
maison         0.103673
ecologique     0.103390
Name: bois, dtype: float32

electrique


electrique     1.000000
nucleaire      0.366279
production     0.230453
tout           0.224342
electricite    0.161398
chauffage      0.136957
bois           0.120404
energie        0.104486
gaz            0.098607
maison         0.087347
Name: electrique, dtype: float32

installation


installation    1.000000
panneaux        0.164128
solaires        0.153031
cout            0.134666
solaire         0.099471
pompe           0.092459
chaleur         0.089401
aide            0.078389
prix            0.075574
energie         0.062465
Name: installation, dtype: float32

In [67]:
for i in df_qu_10_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_10[i].sort_values(ascending=False).head(10))

chauffage


chauffage     0.000176
mode          0.000163
collectif     0.000132
modes         0.000123
electrique    0.000105
systeme       0.000090
type          0.000086
changer       0.000084
ecologique    0.000082
systemes      0.000079
Name: chauffage, dtype: float32

aide


aide            0.000312
financiere      0.000249
fiscale         0.000094
revenus         0.000080
financement     0.000075
changement      0.000062
installation    0.000062
achat           0.000059
chaudiere       0.000048
credit          0.000047
Name: aide, dtype: float32

aides


aides          0.000347
financieres    0.000287
fiscales       0.000125
revenus        0.000112
impots         0.000066
travaux        0.000060
changement     0.000057
tous           0.000057
moyens         0.000050
isolation      0.000048
Name: aides, dtype: float32

chaleur


chaleur         0.000461
pompe           0.000457
pompes          0.000426
eau             0.000124
installer       0.000089
gaz             0.000071
installation    0.000070
chaudiere       0.000070
ans             0.000069
geothermie      0.000068
Name: chaleur, dtype: float32

chaudiere


chaudiere       0.000489
condensation    0.000444
fuel            0.000247
fioul           0.000238
remplacer       0.000197
gaz             0.000173
granules        0.000147
changer         0.000129
changement      0.000118
ans             0.000116
Name: chaudiere, dtype: float32

panneaux


panneaux           0.000491
solaires           0.000446
photovoltaiques    0.000411
toit               0.000287
installer          0.000182
installation       0.000129
eau                0.000102
mettre             0.000093
exemple            0.000080
electricite        0.000068
Name: panneaux, dtype: float32

isolation


isolation        0.000507
ameliorer        0.000241
thermique        0.000228
meilleure        0.000222
batiments        0.000193
logements        0.000162
travaux          0.000119
proprietaires    0.000099
logement         0.000095
maison           0.000085
Name: isolation, dtype: float32

faire


faire            0.000517
travaux          0.000135
proprietaires    0.000108
mieux            0.000108
moyens           0.000099
faut             0.000095
pouvoir          0.000090
tout             0.000081
tous             0.000078
logement         0.000075
Name: faire, dtype: float32

changer


changer      0.000519
mode         0.000167
chaudiere    0.000129
fioul        0.000125
systeme      0.000108
moyens       0.000102
isoler       0.000099
ans          0.000088
chauffage    0.000084
faut         0.000081
Name: changer, dtype: float32

solaire


solaire         0.000529
eolien          0.000372
eau             0.000201
production      0.000115
chauffe         0.000112
energie         0.000108
geothermie      0.000102
installation    0.000078
electricite     0.000065
panneaux        0.000060
Name: solaire, dtype: float32

gaz


gaz             0.000557
ville           0.000323
condensation    0.000270
chaudiere       0.000173
fuel            0.000151
fioul           0.000144
actuellement    0.000126
chauffe         0.000126
electricite     0.000098
bois            0.000090
Name: gaz, dtype: float32

energie


energie         0.000568
renouvelable    0.000360
propre          0.000236
production      0.000197
nucleaire       0.000176
consommation    0.000139
solaire         0.000108
tous            0.000084
electricite     0.000083
faut            0.000082
Name: energie, dtype: float32

solaires


solaires        0.000589
panneaux        0.000446
toit            0.000276
installer       0.000178
installation    0.000120
eau             0.000105
mettre          0.000090
electricite     0.000060
maison          0.000050
energie         0.000049
Name: solaires, dtype: float32

financiere


financiere     0.000592
aide           0.000249
incitation     0.000240
changer        0.000035
chaudiere      0.000031
chauffage      0.000020
financement         NaN
immeuble            NaN
installer           NaN
cout                NaN
Name: financiere, dtype: float32

mode


mode          0.000612
changer       0.000167
chauffage     0.000163
ecologique    0.000132
changement    0.000115
locataire     0.000087
faut          0.000086
faudrait      0.000072
isolation     0.000064
tout          0.000061
Name: mode, dtype: float32

pompe


pompe           0.000656
chaleur         0.000457
eau             0.000137
installer       0.000109
chaudiere       0.000086
ans             0.000078
gaz             0.000075
installation    0.000073
maison          0.000068
bois            0.000058
Name: pompe, dtype: float32

prix


prix            0.000675
baisser         0.000317
electricite     0.000082
installation    0.000059
faire           0.000056
gaz             0.000054
chaleur         0.000049
energie         0.000049
pompe           0.000047
chaudiere       0.000045
Name: prix, dtype: float32

bois


bois           0.000721
poele          0.000371
granules       0.000312
chauffe        0.000212
electrique     0.000092
gaz            0.000090
chaudiere      0.000084
electricite    0.000083
maison         0.000075
ecologique     0.000075
Name: bois, dtype: float32

electrique


electrique     0.000766
nucleaire      0.000281
production     0.000177
tout           0.000172
electricite    0.000124
chauffage      0.000105
bois           0.000092
energie        0.000080
gaz            0.000076
maison         0.000067
Name: electrique, dtype: float32

installation


installation    0.000786
panneaux        0.000129
solaires        0.000120
cout            0.000106
solaire         0.000078
pompe           0.000073
chaleur         0.000070
aide            0.000062
prix            0.000059
energie         0.000049
Name: installation, dtype: float32

In [68]:
gc.collect()

147

# Question 11 : Avez-vous pour vos déplacements quotidiens la possibilité de recourir à des solutions de mobilité alternatives à la voiture individuelle comme les transports en commun, le covoiturage, l'auto-partage, le transport à la demande, le vélo, etc. ?

In [69]:
question_11 = "Avez-vous pour vos déplacements quotidiens la possibilité de recourir à des solutions de mobilité alternatives à la voiture individuelle comme les transports en commun, le covoiturage, l'auto-partage, le transport à la demande, le vélo, etc. ?"
qu_11,df_qu_11_one_hot,df_cov_11,df_confidence_11,df_lift_11 = compute_similarities(question_11, new_res)

In [70]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_11[i].sort_values(ascending=False).head(10))

oui


oui             19088
voiture             0
quotidiens          0
deplacements        0
non                 0
utilise             0
Name: oui, dtype: uint16

non


non             17924
voiture             0
quotidiens          0
deplacements        0
oui                 0
utilise             0
Name: non, dtype: uint16

voiture


voiture         9999
quotidiens      9999
deplacements    9999
utilise         9999
oui                0
non                0
Name: voiture, dtype: uint16

quotidiens


voiture         9999
quotidiens      9999
deplacements    9999
utilise         9999
oui                0
non                0
Name: quotidiens, dtype: uint16

deplacements


voiture         9999
quotidiens      9999
deplacements    9999
utilise         9999
oui                0
non                0
Name: deplacements, dtype: uint16

utilise


voiture         9999
quotidiens      9999
deplacements    9999
utilise         9999
oui                0
non                0
Name: utilise, dtype: uint16

In [71]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_11[i].sort_values(ascending=False).head(10))

oui


oui             1.0
voiture         0.0
quotidiens      0.0
deplacements    0.0
non             0.0
utilise         0.0
Name: oui, dtype: float32

non


non             1.0
voiture         0.0
quotidiens      0.0
deplacements    0.0
oui             0.0
utilise         0.0
Name: non, dtype: float32

voiture


voiture         1.0
quotidiens      1.0
deplacements    1.0
utilise         1.0
oui             0.0
non             0.0
Name: voiture, dtype: float32

quotidiens


voiture         1.0
quotidiens      1.0
deplacements    1.0
utilise         1.0
oui             0.0
non             0.0
Name: quotidiens, dtype: float32

deplacements


voiture         1.0
quotidiens      1.0
deplacements    1.0
utilise         1.0
oui             0.0
non             0.0
Name: deplacements, dtype: float32

utilise


voiture         1.0
quotidiens      1.0
deplacements    1.0
utilise         1.0
oui             0.0
non             0.0
Name: utilise, dtype: float32

In [72]:
for i in df_qu_11_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_11[i].sort_values(ascending=False).head(10))

oui


oui             0.000052
utilise              NaN
non                  NaN
deplacements         NaN
quotidiens           NaN
voiture              NaN
Name: oui, dtype: float32

non


non             0.000056
utilise              NaN
oui                  NaN
deplacements         NaN
quotidiens           NaN
voiture              NaN
Name: non, dtype: float32

voiture


voiture         0.0001
quotidiens      0.0001
deplacements    0.0001
utilise         0.0001
non                NaN
oui                NaN
Name: voiture, dtype: float32

quotidiens


voiture         0.0001
quotidiens      0.0001
deplacements    0.0001
utilise         0.0001
non                NaN
oui                NaN
Name: quotidiens, dtype: float32

deplacements


voiture         0.0001
quotidiens      0.0001
deplacements    0.0001
utilise         0.0001
non                NaN
oui                NaN
Name: deplacements, dtype: float32

utilise


voiture         0.0001
quotidiens      0.0001
deplacements    0.0001
utilise         0.0001
non                NaN
oui                NaN
Name: utilise, dtype: float32

In [73]:
gc.collect()

217

# Question 12 :  Si oui, que faudrait-il faire pour vous convaincre ou vous aider à utiliser ces solutions alternatives ?

In [74]:
question_12 = "Si oui, que faudrait-il faire pour vous convaincre ou vous aider à utiliser ces solutions alternatives ?"
qu_12,df_qu_12_one_hot,df_cov_12,df_confidence_12,df_lift_12 = compute_similarities(question_12, new_res)

In [75]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_12[i].sort_values(ascending=False).head(10))

transports


transports    6604
commun        4500
voiture        861
developper     741
bus            693
velo           677
gratuite       656
cyclables      640
transport      624
communs        608
Name: transports, dtype: uint16

commun


commun        5934
transports    4500
transport     1854
voiture        887
velo           727
developper     631
bus            615
cyclables      579
pistes         559
utilise        497
Name: commun, dtype: uint16

transport


transport     3123
commun        1854
voiture        633
transports     624
velo           443
bus            418
travail        349
temps          320
developper     290
ville          277
Name: transport, dtype: uint16

velo


velo          3062
commun         727
transports     677
electrique     583
cyclables      573
pistes         567
voiture        560
utilise        470
transport      443
bus            373
Name: velo, dtype: uint16

voiture


voiture       3049
commun         887
transports     861
transport      633
bus            561
velo           560
travail        463
prendre        420
utilise        412
aller          380
Name: voiture, dtype: uint16

bus


bus           2747
transports     693
commun         615
voiture        561
transport      418
velo           373
train          361
horaires       343
ville          330
travail        306
Name: bus, dtype: uint16

cyclables


cyclables     2234
pistes        1996
transports     640
commun         579
velo           573
developper     366
securisees     312
bus            273
ville          242
transport      225
Name: cyclables, dtype: uint16

pistes


pistes        2140
cyclables     1996
transports     603
velo           567
commun         559
developper     350
securisees     306
bus            256
ville          226
transport      224
Name: pistes, dtype: uint16

utilise


utilise        1942
transports      516
commun          497
velo            470
voiture         412
bus             186
transport       181
covoiturage     159
ville           154
travail         141
Name: utilise, dtype: uint16

developper


developper     1616
transports      741
commun          631
cyclables       366
pistes          350
transport       290
bus             222
velo            189
covoiturage     187
voiture         185
Name: developper, dtype: uint16

travail


travail       1607
commun         474
voiture        463
transports     434
horaires       411
transport      349
velo           344
bus            306
lieu           297
aller          272
Name: travail, dtype: uint16

covoiturage


covoiturage    1531
commun          448
transports      418
velo            280
transport       275
voiture         243
bus             217
travail         201
developper      187
horaires        174
Name: covoiturage, dtype: uint16

horaires


horaires       1478
transports      486
commun          460
travail         411
bus             343
transport       247
voiture         212
covoiturage     174
train           163
velo            139
Name: horaires, dtype: uint16

ville


ville         1473
transports     493
commun         464
voiture        371
velo           335
bus            330
transport      277
centre         252
cyclables      242
pistes         226
Name: ville, dtype: uint16

faire


faire         1406
transports     374
voiture        363
commun         363
velo           349
transport      257
bus            238
travail        212
faut           201
aller          191
Name: faire, dtype: uint16

train


train         1204
bus            361
transports     360
voiture        331
commun         326
transport      218
velo           179
prendre        170
horaires       163
travail        155
Name: train, dtype: uint16

faut


faut          1122
transports     418
commun         352
voiture        318
transport      242
bus            220
velo           206
faire          201
ville          152
developper     150
Name: faut, dtype: uint16

temps


temps         1085
commun         382
voiture        365
transports     346
transport      320
trajet         277
travail        226
bus            207
velo           195
faire          135
Name: temps, dtype: uint16

solutions


solutions       1051
alternatives     427
transports       223
commun           205
voiture          192
transport        174
utilise          122
covoiturage      117
faut             114
velo             113
Name: solutions, dtype: uint16

electrique


electrique    1010
velo           583
voiture        277
achat          188
commun         160
transports     153
aide           143
vehicule       139
transport      126
bus            108
Name: electrique, dtype: uint16

In [76]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_12[i].sort_values(ascending=False).head(10))

transports


transports    1.000000
communs       0.929664
collectifs    0.850394
publics       0.789346
commun        0.758342
gratuite      0.718510
gratuits      0.715084
fiables       0.681275
frequents     0.620462
adaptes       0.546099
Name: transports, dtype: float32

commun


commun           1.000000
transports       0.681405
transport        0.593660
gratuite         0.498357
fiables          0.466135
gratuits         0.454376
gratuit          0.452436
developpement    0.448370
reseaux          0.446565
adaptes          0.432624
Name: commun, dtype: float32

transport


transport    1.000000
demande      0.588636
gratuit      0.480278
moyens       0.340594
offre        0.319196
commun       0.312437
1            0.297935
temps        0.294931
reseau       0.286990
trajet       0.267857
Name: transport, dtype: float32

velo


velo          1.000000
electrique    0.577228
achat         0.549865
aide          0.446237
route         0.438662
pied          0.405836
piste         0.389881
marche        0.375267
routes        0.373737
cyclable      0.371105
Name: velo, dtype: float32

voiture


voiture       1.000000
prends        0.518797
prendre       0.488941
courses       0.428571
aller         0.420819
trajet        0.409341
travailler    0.406040
3             0.379310
deplacer      0.362712
2             0.362000
Name: voiture, dtype: float32

bus


bus       1.000000
tram      0.550296
metro     0.453586
ligne     0.397260
lignes    0.390411
heure     0.379653
1         0.348083
gare      0.338798
heures    0.321429
trains    0.312849
Name: bus, dtype: float32

cyclables


cyclables        1.000000
pistes           0.932710
securisees       0.823219
voies            0.436475
routes           0.417508
creer            0.295775
developpement    0.288043
velos            0.284785
securite         0.229839
developper       0.226485
Name: cyclables, dtype: float32

pistes


pistes        1.000000
cyclables     0.893465
securisees    0.807388
routes        0.367003
creer         0.279678
velos         0.271782
securite      0.225806
developper    0.216584
voitures      0.208333
reseau        0.188776
Name: pistes, dtype: float32

utilise


utilise         1.000000
marche          0.230277
deplacements    0.174404
velo            0.153494
voiture         0.135126
aller           0.126246
solutions       0.116080
ville           0.104549
covoiturage     0.103854
train           0.099668
Name: utilise, dtype: float32

developper


developper     1.000000
reseau         0.181122
cyclables      0.163832
pistes         0.163551
lignes         0.163014
villes         0.149789
faut           0.133690
covoiturage    0.122142
transports     0.112205
commun         0.106336
Name: developper, dtype: float32

travail


travail     1.000000
domicile    0.620525
lieu        0.620042
aller       0.301218
horaires    0.278078
trajet      0.274725
km          0.251248
heures      0.241071
temps       0.208295
trajets     0.183453
Name: travail, dtype: float32

covoiturage


covoiturage    1.000000
auto           0.325714
partage        0.301508
place          0.136919
travail        0.125078
horaires       0.117727
faire          0.117354
developper     0.115718
faudrait       0.113147
solutions      0.111323
Name: covoiturage, dtype: float32

horaires


horaires       1.000000
adaptes        0.482269
travail        0.255756
trains         0.145251
trajet         0.140110
prendre        0.137369
train          0.135382
bus            0.124863
covoiturage    0.113651
temps          0.110599
Name: horaires, dtype: float32

ville


ville       1.000000
centre      0.717949
grande      0.318452
habite      0.244328
aller       0.182724
voitures    0.174107
campagne    0.161926
villes      0.149789
velos       0.149545
prendre     0.146682
Name: ville, dtype: float32

faire


faire      1.000000
courses    0.615079
km         0.229617
aller      0.211517
tout       0.184179
faut       0.179144
prendre    0.166473
tous       0.162162
trajet     0.153846
non        0.147383
Name: faire, dtype: float32

train


train       1.000000
gare        0.311475
prendre     0.197905
lignes      0.186301
trains      0.163408
prix        0.156408
aller       0.143965
bus         0.131416
horaires    0.110284
voiture     0.108560
Name: train, dtype: float32

faut


faut         1.000000
prendre      0.164144
tout         0.145218
aller        0.145072
faire        0.142959
villes       0.123418
solutions    0.108468
temps        0.105991
voiture      0.104296
ville        0.103191
Name: faut, dtype: float32

temps


temps        1.000000
trajet       0.380495
travail      0.140635
prendre      0.139697
aller        0.139535
tout         0.127509
voiture      0.119711
faut         0.102496
transport    0.102466
faire        0.096017
Name: temps, dtype: float32

solutions


solutions       1.000000
alternatives    0.715243
faut            0.101604
covoiturage     0.076421
voiture         0.062971
utilise         0.062822
transport       0.055716
velo            0.036904
bus             0.036767
commun          0.034547
Name: solutions, dtype: float32

electrique


electrique    1.000000
achat         0.506739
aide          0.384409
vehicule      0.215170
velo          0.190398
voiture       0.090849
transport     0.040346
bus           0.039316
commun        0.026963
transports    0.023168
Name: electrique, dtype: float32

In [77]:
for i in df_qu_12_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_12[i].sort_values(ascending=False).head(10))

transports


transports    0.000151
communs       0.000141
collectifs    0.000129
publics       0.000120
commun        0.000115
gratuite      0.000109
gratuits      0.000108
fiables       0.000103
frequents     0.000094
adaptes       0.000083
Name: transports, dtype: float32

commun


commun           0.000169
transports       0.000115
transport        0.000100
gratuite         0.000084
fiables          0.000079
gratuits         0.000077
gratuit          0.000076
developpement    0.000076
reseaux          0.000075
adaptes          0.000073
Name: commun, dtype: float32

transport


transport    0.000320
demande      0.000188
gratuit      0.000154
moyens       0.000109
offre        0.000102
commun       0.000100
1            0.000095
temps        0.000094
reseau       0.000092
trajet       0.000086
Name: transport, dtype: float32

velo


velo          0.000327
electrique    0.000189
achat         0.000180
aide          0.000146
route         0.000143
pied          0.000133
piste         0.000127
marche        0.000123
routes        0.000122
cyclable      0.000121
Name: velo, dtype: float32

voiture


voiture       0.000328
prends        0.000170
prendre       0.000160
courses       0.000141
aller         0.000138
trajet        0.000134
travailler    0.000133
3             0.000124
deplacer      0.000119
2             0.000119
Name: voiture, dtype: float32

bus


bus       0.000364
tram      0.000200
metro     0.000165
ligne     0.000145
lignes    0.000142
heure     0.000138
1         0.000127
gare      0.000123
heures    0.000117
trains    0.000114
Name: bus, dtype: float32

cyclables


cyclables        0.000448
pistes           0.000418
securisees       0.000368
voies            0.000195
routes           0.000187
creer            0.000132
developpement    0.000129
velos            0.000127
securite         0.000103
developper       0.000101
Name: cyclables, dtype: float32

pistes


pistes        0.000467
cyclables     0.000418
securisees    0.000377
routes        0.000171
creer         0.000131
velos         0.000127
securite      0.000106
developper    0.000101
voitures      0.000097
reseau        0.000088
Name: pistes, dtype: float32

utilise


utilise         0.000515
marche          0.000119
deplacements    0.000090
velo            0.000079
voiture         0.000070
aller           0.000065
solutions       0.000060
ville           0.000054
covoiturage     0.000053
train           0.000051
Name: utilise, dtype: float32

developper


developper     0.000619
reseau         0.000112
cyclables      0.000101
pistes         0.000101
lignes         0.000101
villes         0.000093
faut           0.000083
covoiturage    0.000076
transports     0.000069
commun         0.000066
Name: developper, dtype: float32

travail


travail     0.000622
domicile    0.000386
lieu        0.000386
aller       0.000187
horaires    0.000173
trajet      0.000171
km          0.000156
heures      0.000150
temps       0.000130
trajets     0.000114
Name: travail, dtype: float32

covoiturage


covoiturage    0.000653
auto           0.000213
partage        0.000197
place          0.000089
travail        0.000082
horaires       0.000077
faire          0.000077
developper     0.000076
faudrait       0.000074
solutions      0.000073
Name: covoiturage, dtype: float32

horaires


horaires       0.000677
adaptes        0.000326
travail        0.000173
trains         0.000098
trajet         0.000095
prendre        0.000093
train          0.000092
bus            0.000084
covoiturage    0.000077
temps          0.000075
Name: horaires, dtype: float32

ville


ville       0.000679
centre      0.000487
grande      0.000216
habite      0.000166
aller       0.000124
voitures    0.000118
campagne    0.000110
villes      0.000102
velos       0.000102
prendre     0.000100
Name: ville, dtype: float32

faire


faire      0.000711
courses    0.000437
km         0.000163
aller      0.000150
tout       0.000131
faut       0.000127
prendre    0.000118
tous       0.000115
trajet     0.000109
non        0.000105
Name: faire, dtype: float32

train


train       0.000831
gare        0.000259
prendre     0.000164
lignes      0.000155
trains      0.000136
prix        0.000130
aller       0.000120
bus         0.000109
horaires    0.000092
voiture     0.000090
Name: train, dtype: float32

faut


faut         0.000891
prendre      0.000146
tout         0.000129
aller        0.000129
faire        0.000127
villes       0.000110
solutions    0.000097
temps        0.000094
voiture      0.000093
ville        0.000092
Name: faut, dtype: float32

temps


temps        0.000922
trajet       0.000351
travail      0.000130
prendre      0.000129
aller        0.000129
tout         0.000118
voiture      0.000110
faut         0.000094
transport    0.000094
faire        0.000088
Name: temps, dtype: float32

solutions


solutions       0.000951
alternatives    0.000681
faut            0.000097
covoiturage     0.000073
voiture         0.000060
utilise         0.000060
transport       0.000053
velo            0.000035
bus             0.000035
commun          0.000033
Name: solutions, dtype: float32

electrique


electrique    0.000990
achat         0.000502
aide          0.000381
vehicule      0.000213
velo          0.000189
voiture       0.000090
transport     0.000040
bus           0.000039
commun        0.000027
transports    0.000023
Name: electrique, dtype: float32

In [78]:
gc.collect()

140

# Question 13 :   Si non, quelles sont les solutions de mobilité alternatives que vous souhaiteriez pouvoir utiliser ?

In [79]:
question_13 = "Si non, quelles sont les solutions de mobilité alternatives que vous souhaiteriez pouvoir utiliser ?"
qu_13,df_qu_13_one_hot,df_cov_13,df_confidence_13,df_lift_13 = compute_similarities(question_13, new_res)

In [80]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_13[i].sort_values(ascending=False).head(10))

commun


commun         21763
transports     21660
velo            9072
transport       5817
covoiturage     5749
demande         5612
auto            3507
partage         3500
marche           502
electrique       430
Name: commun, dtype: uint16

transports


transports     21761
commun         21660
velo            9053
covoiturage     5744
transport       5736
demande         5609
auto            3505
partage         3498
marche           502
electrique       428
Name: transports, dtype: uint16

velo


velo           12867
commun          9072
transports      9053
covoiturage     3860
transport       3243
demande         3152
partage         2640
auto            2637
electrique       549
marche           447
Name: velo, dtype: uint16

transport


transport      8666
demande        8289
commun         5817
transports     5736
velo           3243
covoiturage    2659
auto           2354
partage        2354
electrique      243
voiture         187
Name: transport, dtype: uint16

demande


demande        8320
transport      8289
commun         5612
transports     5609
velo           3152
covoiturage    2617
partage        2330
auto           2329
electrique      216
voiture         142
Name: demande, dtype: uint16

covoiturage


covoiturage    7808
commun         5749
transports     5744
velo           3860
auto           2986
partage        2982
transport      2659
demande        2617
marche          195
electrique      151
Name: covoiturage, dtype: uint16

auto


auto           5067
partage        5030
commun         3507
transports     3505
covoiturage    2986
velo           2637
transport      2354
demande        2329
electrique      138
marche          104
Name: auto, dtype: uint16

partage


partage        5053
auto           5030
commun         3500
transports     3498
covoiturage    2982
velo           2640
transport      2354
demande        2330
electrique      136
marche          105
Name: partage, dtype: uint16

voiture


voiture        1471
electrique      467
commun          293
transports      289
velo            223
transport       187
demande         142
campagne        116
covoiturage     106
solutions         0
Name: voiture, dtype: uint16

electrique


electrique     1299
velo            549
voiture         467
commun          430
transports      428
transport       243
vehicule        224
demande         216
covoiturage     151
auto            138
Name: electrique, dtype: uint16

marche


marche         748
commun         502
transports     502
velo           447
pied           316
covoiturage    195
transport      140
demande        132
partage        105
auto           104
Name: marche, dtype: uint16

vehicule


vehicule      616
electrique    224
commun        108
transports    106
solutions       0
tout            0
transport       0
pied            0
train           0
bus             0
Name: vehicule, dtype: uint16

pied


pied           480
marche         316
commun         292
transports     292
velo           265
covoiturage    113
solutions        0
teletravail      0
vehicule         0
transport        0
Name: pied, dtype: uint16

travail


travail       420
transports    125
commun        122
solutions       0
vehicule        0
transport       0
pied            0
train           0
bus             0
demande         0
Name: travail, dtype: uint16

train


train         416
commun        273
transports    271
velo          155
solutions       0
tout            0
vehicule        0
transport       0
pied            0
bus             0
Name: train, dtype: uint16

campagne


campagne     397
voiture      116
solutions      0
tout           0
vehicule       0
commun         0
transport      0
pied           0
train          0
bus            0
Name: campagne, dtype: uint16

teletravail


teletravail    365
transports     149
commun         146
solutions        0
travail          0
vehicule         0
transport        0
pied             0
train            0
bus              0
Name: teletravail, dtype: uint16

solution


solution       325
travail          0
vehicule         0
commun           0
transport        0
pied             0
train            0
bus              0
demande          0
teletravail      0
Name: solution, dtype: uint16

electriques


electriques    283
transports     146
commun         137
velo           113
solutions        0
tout             0
vehicule         0
transport        0
pied             0
train            0
Name: electriques, dtype: uint16

tout


tout          277
commun        109
transports    108
solutions       0
travail         0
vehicule        0
transport       0
pied            0
train           0
bus             0
Name: tout, dtype: uint16

In [81]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_13[i].sort_values(ascending=False).head(10))

commun


commun         1.000000
transports     0.995359
covoiturage    0.736296
velo           0.705059
partage        0.692658
auto           0.692125
demande        0.674519
transport      0.671244
marche         0.671123
train          0.656250
Name: commun, dtype: float32

transports


transports     1.000000
commun         0.995267
covoiturage    0.735656
velo           0.703583
partage        0.692262
auto           0.691731
demande        0.674159
marche         0.671123
transport      0.661897
train          0.651442
Name: transports, dtype: float32

velo


velo           1.000000
marche         0.597594
pied           0.552083
partage        0.522462
auto           0.520426
covoiturage    0.494365
electrique     0.422633
commun         0.416854
transports     0.416019
electriques    0.399293
Name: velo, dtype: float32

transport


transport      1.000000
demande        0.996274
partage        0.465862
auto           0.464575
covoiturage    0.340548
commun         0.267289
transports     0.263591
velo           0.252040
marche         0.187166
electrique     0.187067
Name: transport, dtype: float32

demande


demande        1.000000
transport      0.956497
partage        0.461112
auto           0.459641
covoiturage    0.335169
commun         0.257869
transports     0.257755
velo           0.244968
marche         0.176471
electrique     0.166282
Name: demande, dtype: float32

covoiturage


covoiturage    1.000000
partage        0.590144
auto           0.589303
demande        0.314543
transport      0.306831
velo           0.299992
commun         0.264164
transports     0.263958
marche         0.260695
pied           0.235417
Name: covoiturage, dtype: float32

auto


auto           1.000000
partage        0.995448
covoiturage    0.382428
demande        0.279928
transport      0.271636
velo           0.204943
commun         0.161145
transports     0.161068
marche         0.139037
electrique     0.106236
Name: auto, dtype: float32

partage


partage        1.000000
auto           0.992698
covoiturage    0.381916
demande        0.280048
transport      0.271636
velo           0.205176
commun         0.160823
transports     0.160746
marche         0.140374
electrique     0.104696
Name: partage, dtype: float32

voiture


voiture        1.000000
electrique     0.359507
campagne       0.292191
transport      0.021579
velo           0.017331
demande        0.017067
covoiturage    0.013576
commun         0.013463
transports     0.013281
solutions      0.000000
Name: voiture, dtype: float32

electrique


electrique    1.000000
vehicule      0.363636
voiture       0.317471
velo          0.042667
transport     0.028041
auto          0.027235
partage       0.026915
demande       0.025962
commun        0.019758
transports    0.019668
Name: electrique, dtype: float32

marche


marche         1.000000
pied           0.658333
velo           0.034740
covoiturage    0.024974
transports     0.023069
commun         0.023067
partage        0.020780
auto           0.020525
transport      0.016155
demande        0.015865
Name: marche, dtype: float32

vehicule


vehicule      1.000000
electrique    0.172440
commun        0.004963
transports    0.004871
solutions     0.000000
tout          0.000000
transport     0.000000
pied          0.000000
train         0.000000
bus           0.000000
Name: vehicule, dtype: float32

pied


pied           1.000000
marche         0.422460
velo           0.020595
covoiturage    0.014472
transports     0.013419
commun         0.013417
solutions      0.000000
teletravail    0.000000
vehicule       0.000000
transport      0.000000
Name: pied, dtype: float32

travail


travail       1.000000
transports    0.005744
commun        0.005606
solutions     0.000000
vehicule      0.000000
transport     0.000000
pied          0.000000
train         0.000000
bus           0.000000
demande       0.000000
Name: travail, dtype: float32

train


train         1.000000
commun        0.012544
transports    0.012453
velo          0.012046
solutions     0.000000
tout          0.000000
vehicule      0.000000
transport     0.000000
pied          0.000000
bus           0.000000
Name: train, dtype: float32

campagne


campagne     1.000000
voiture      0.078858
solutions    0.000000
tout         0.000000
vehicule     0.000000
commun       0.000000
transport    0.000000
pied         0.000000
train        0.000000
bus          0.000000
Name: campagne, dtype: float32

teletravail


teletravail    1.000000
transports     0.006847
commun         0.006709
solutions      0.000000
travail        0.000000
vehicule       0.000000
transport      0.000000
pied           0.000000
train          0.000000
bus            0.000000
Name: teletravail, dtype: float32

solution


solution       1.0
travail        0.0
vehicule       0.0
commun         0.0
transport      0.0
pied           0.0
train          0.0
bus            0.0
demande        0.0
teletravail    0.0
Name: solution, dtype: float32

electriques


electriques    1.000000
velo           0.008782
transports     0.006709
commun         0.006295
solutions      0.000000
tout           0.000000
vehicule       0.000000
transport      0.000000
pied           0.000000
train          0.000000
Name: electriques, dtype: float32

tout


tout          1.000000
commun        0.005009
transports    0.004963
solutions     0.000000
travail       0.000000
vehicule      0.000000
transport     0.000000
pied          0.000000
train         0.000000
bus           0.000000
Name: tout, dtype: float32

In [82]:
for i in df_qu_13_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_13[i].sort_values(ascending=False).head(10))

commun


commun         0.000046
transports     0.000046
covoiturage    0.000034
velo           0.000032
partage        0.000032
auto           0.000032
demande        0.000031
transport      0.000031
marche         0.000031
train          0.000030
Name: commun, dtype: float32

transports


transports     0.000046
commun         0.000046
covoiturage    0.000034
velo           0.000032
partage        0.000032
auto           0.000032
demande        0.000031
marche         0.000031
transport      0.000030
train          0.000030
Name: transports, dtype: float32

velo


velo           0.000078
marche         0.000046
pied           0.000043
partage        0.000041
auto           0.000040
covoiturage    0.000038
electrique     0.000033
commun         0.000032
transports     0.000032
electriques    0.000031
Name: velo, dtype: float32

transport


transport      0.000115
demande        0.000115
partage        0.000054
auto           0.000054
covoiturage    0.000039
commun         0.000031
transports     0.000030
velo           0.000029
marche         0.000022
electrique     0.000022
Name: transport, dtype: float32

demande


demande        0.000120
transport      0.000115
partage        0.000055
auto           0.000055
covoiturage    0.000040
commun         0.000031
transports     0.000031
velo           0.000029
marche         0.000021
electrique     0.000020
Name: demande, dtype: float32

covoiturage


covoiturage    0.000128
partage        0.000076
auto           0.000075
demande        0.000040
transport      0.000039
velo           0.000038
commun         0.000034
transports     0.000034
marche         0.000033
pied           0.000030
Name: covoiturage, dtype: float32

auto


auto           0.000197
partage        0.000196
covoiturage    0.000075
demande        0.000055
transport      0.000054
velo           0.000040
commun         0.000032
transports     0.000032
marche         0.000027
electrique     0.000021
Name: auto, dtype: float32

partage


partage        0.000198
auto           0.000196
covoiturage    0.000076
demande        0.000055
transport      0.000054
velo           0.000041
commun         0.000032
transports     0.000032
marche         0.000028
electrique     0.000021
Name: partage, dtype: float32

voiture


voiture        0.000680
electrique     0.000244
campagne       0.000199
transport      0.000015
velo           0.000012
demande        0.000012
covoiturage    0.000009
commun         0.000009
transports     0.000009
auto                NaN
Name: voiture, dtype: float32

electrique


electrique    0.000770
vehicule      0.000280
voiture       0.000244
velo          0.000033
transport     0.000022
auto          0.000021
partage       0.000021
demande       0.000020
commun        0.000015
transports    0.000015
Name: electrique, dtype: float32

marche


marche         0.001337
pied           0.000880
velo           0.000046
covoiturage    0.000033
transports     0.000031
commun         0.000031
partage        0.000028
auto           0.000027
transport      0.000022
demande        0.000021
Name: marche, dtype: float32

vehicule


vehicule      0.001623
electrique    0.000280
commun        0.000008
transports    0.000008
auto               NaN
transport          NaN
pied               NaN
train              NaN
bus                NaN
demande            NaN
Name: vehicule, dtype: float32

pied


pied           0.002083
marche         0.000880
velo           0.000043
covoiturage    0.000030
transports     0.000028
commun         0.000028
auto                NaN
vehicule            NaN
transport           NaN
train               NaN
Name: pied, dtype: float32

travail


travail       0.002381
transports    0.000014
commun        0.000013
auto               NaN
vehicule           NaN
transport          NaN
pied               NaN
train              NaN
bus                NaN
demande            NaN
Name: travail, dtype: float32

train


train         0.002404
commun        0.000030
transports    0.000030
velo          0.000029
auto               NaN
vehicule           NaN
transport          NaN
pied               NaN
bus                NaN
demande            NaN
Name: train, dtype: float32

campagne


campagne     0.002519
voiture      0.000199
auto              NaN
vehicule          NaN
commun            NaN
transport         NaN
pied              NaN
train             NaN
bus               NaN
demande           NaN
Name: campagne, dtype: float32

teletravail


teletravail    0.002740
transports     0.000019
commun         0.000018
auto                NaN
vehicule            NaN
transport           NaN
pied                NaN
train               NaN
bus                 NaN
demande             NaN
Name: teletravail, dtype: float32

solution


solution       0.003077
auto                NaN
vehicule            NaN
commun              NaN
transport           NaN
pied                NaN
train               NaN
bus                 NaN
demande             NaN
teletravail         NaN
Name: solution, dtype: float32

electriques


electriques    0.003534
velo           0.000031
transports     0.000024
commun         0.000022
auto                NaN
vehicule            NaN
transport           NaN
pied                NaN
train               NaN
bus                 NaN
Name: electriques, dtype: float32

tout


tout          0.003610
commun        0.000018
transports    0.000018
auto               NaN
vehicule           NaN
transport          NaN
pied               NaN
train              NaN
bus                NaN
demande            NaN
Name: tout, dtype: float32

In [83]:
gc.collect()

147

# Question 14 :  Et qui doit selon vous se charger de vous proposer ce type de solutions alternatives ?

In [84]:
question_14 = "Et qui doit selon vous se charger de vous proposer ce type de solutions alternatives ?"
qu_14,df_qu_14_one_hot,df_cov_14,df_confidence_14,df_lift_14 = compute_similarities(question_14, new_res)

In [85]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_14[i].sort_values(ascending=False).head(10))

collectivites


collectivites    5188
locales          2318
territoriales    1418
entreprises       505
transports        394
commun            296
transport         223
region            202
solutions         200
communes          191
Name: collectivites, dtype: uint16

region


region           5137
departement      1563
commune           887
communes          439
transports        352
ville             298
commun            270
communaute        234
transport         206
collectivites     202
Name: region, dtype: uint16

departement


departement    3447
region         1563
commune         825
communes        380
communaute      213
ville           201
transports      195
mairie          185
commun          160
transport       146
Name: departement, dtype: uint16

communes


communes         3413
communaute        619
regions           570
communautes       521
region            439
departements      420
departement       380
transports        246
collectivites     191
commune           189
Name: communes, dtype: uint16

commune


commune             3132
region               887
departement          825
communaute           393
communes             189
transports           167
commun               141
transport            128
intercommunalite     124
services               0
Name: commune, dtype: uint16

locales


locales          2710
collectivites    2318
entreprises       225
transports        174
solutions         128
communes          124
commun            123
region            123
transport         113
regions           103
Name: locales, dtype: uint16

transports


transports       2427
commun           1355
collectivites     394
region            352
transport         256
communes          246
entreprises       227
velo              226
covoiturage       219
departement       195
Name: transports, dtype: uint16

entreprises


entreprises      2306
collectivites     505
privees           418
transports        227
locales           225
transport         194
commun            180
communes          170
tout              164
solutions         151
Name: entreprises, dtype: uint16

regions


regions          1921
communes          570
departements      477
transports        191
collectivites     169
villes            150
commun            124
transport         114
mairies           108
locales           103
Name: regions, dtype: uint16

commun


commun           1911
transports       1355
transport         652
collectivites     296
region            270
velo              236
covoiturage       234
entreprises       180
communes          173
pistes            163
Name: commun, dtype: uint16

transport


transport        1586
commun            652
transports        256
collectivites     223
demande           212
region            206
entreprises       194
communes          169
velo              149
departement       146
Name: transport, dtype: uint16

territoriales


territoriales    1487
collectivites    1418
entreprises       117
transports        110
constructeurs       0
pistes              0
bus                 0
demande             0
tout                0
travail             0
Name: territoriales, dtype: uint16

mairie


mairie           1326
region            186
departement       185
constructeurs       0
bus                 0
demande             0
tout                0
travail             0
moyens              0
commune             0
Name: mairie, dtype: uint16

ville


ville            1254
region            298
departement       201
transports        157
commun            130
constructeurs       0
services            0
bus                 0
demande             0
tout                0
Name: ville, dtype: uint16

tout


tout             1223
monde             462
collectivites     165
transports        165
entreprises       164
faire             162
commun            134
faut              127
solutions         116
voiture           115
Name: tout, dtype: uint16

solutions


solutions        1211
alternatives      299
collectivites     200
proposer          200
transports        170
entreprises       151
commun            137
place             137
locales           128
transport         128
Name: solutions, dtype: uint16

communaute


communaute       1166
communes          619
commune           393
region            234
departement       213
agglomeration     133
constructeurs       0
pistes              0
bus                 0
demande             0
Name: communaute, dtype: uint16

faire


faire            1131
transports        177
tout              162
commun            147
faut              143
collectivites     119
solutions         116
transport         113
entreprises       111
voiture           106
Name: faire, dtype: uint16

departements


departements     1002
regions           477
communes          420
constructeurs       0
public              0
demande             0
tout                0
travail             0
moyens              0
commune             0
Name: departements, dtype: uint16

tous


tous             934
transports       127
collectivites    111
entreprises      106
public             0
demande            0
tout               0
travail            0
moyens             0
commune            0
Name: tous, dtype: uint16

In [86]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_14[i].sort_values(ascending=False).head(10))

collectivites


collectivites    1.000000
territoriales    0.953598
locales          0.855351
associations     0.274351
entreprises      0.218994
citoyens         0.210526
privees          0.186420
solutions        0.165153
transports       0.162340
place            0.156129
Name: collectivites, dtype: float32

region


region              1.000000
departement         0.453438
commune             0.283206
ville               0.237640
intercommunalite    0.234277
communaute          0.200686
niveau              0.195122
bus                 0.157601
sncf                0.145228
transports          0.145035
Name: region, dtype: float32

departement


departement         1.000000
region              0.304263
commune             0.263410
communaute          0.182676
intercommunalite    0.177673
ville               0.160287
mairie              0.139517
communes            0.111339
transport           0.092055
commun              0.083726
Name: departement, dtype: float32

communes


communes        1.000000
communautes     0.731742
communaute      0.530875
departements    0.419162
regions         0.296720
departement     0.110241
transport       0.106557
transports      0.101360
solutions       0.093311
commun          0.090529
Name: communes, dtype: float32

commune


commune             1.000000
communaute          0.337050
departement         0.239339
intercommunalite    0.194969
region              0.172669
transport           0.080706
commun              0.073783
transports          0.068809
communes            0.055376
services            0.000000
Name: commune, dtype: float32

locales


locales          1.000000
collectivites    0.446800
solutions        0.105698
entreprises      0.097572
transports       0.071693
transport        0.071248
commun           0.064364
regions          0.053618
communes         0.036332
departement      0.029881
Name: locales, dtype: float32

transports


transports       1.000000
commun           0.709053
developpement    0.363354
covoiturage      0.360791
demande          0.342029
charge           0.318919
developper       0.302128
train            0.282192
velo             0.278668
bus              0.249651
Name: transports, dtype: float32

entreprises


entreprises     1.000000
privees         0.516049
associations    0.193182
monde           0.186594
citoyens        0.140351
tout            0.134096
solutions       0.124690
transport       0.122320
tous            0.113490
faire           0.098143
Name: entreprises, dtype: float32

regions


regions         1.000000
departements    0.476048
villes          0.179211
communes        0.167009
mairies         0.123147
transports      0.078698
transport       0.071879
commun          0.064887
entreprises     0.044232
locales         0.038007
Name: regions, dtype: float32

commun


commun         1.000000
transports     0.558302
transport      0.411097
covoiturage    0.385502
demande        0.327536
velo           0.290999
developper     0.263830
pistes         0.222982
cyclables      0.213514
voiture        0.209895
Name: commun, dtype: float32

transport


transport      1.000000
demande        0.614493
commun         0.341183
covoiturage    0.224053
societes       0.208251
bus            0.191074
velo           0.183724
service        0.183673
voiture        0.182909
place          0.171613
Name: transport, dtype: float32

territoriales


territoriales    1.000000
collectivites    0.273323
entreprises      0.050737
transports       0.045323
constructeurs    0.000000
pistes           0.000000
bus              0.000000
demande          0.000000
tout             0.000000
travail          0.000000
Name: territoriales, dtype: float32

mairie


mairie           1.000000
departement      0.053670
region           0.036208
constructeurs    0.000000
bus              0.000000
demande          0.000000
tout             0.000000
travail          0.000000
moyens           0.000000
commune          0.000000
Name: mairie, dtype: float32

ville


ville            1.000000
commun           0.068027
transports       0.064689
departement      0.058312
region           0.058011
constructeurs    0.000000
services         0.000000
bus              0.000000
demande          0.000000
tout             0.000000
Name: ville, dtype: float32

tout


tout           1.000000
monde          0.836957
voiture        0.172414
faut           0.144154
faire          0.143236
solutions      0.095789
entreprises    0.071119
commun         0.070120
transports     0.067985
transport      0.065574
Name: tout, dtype: float32

solutions


solutions       1.000000
alternatives    0.698598
proposer        0.352113
place           0.176774
mettre          0.170886
faut            0.130533
faire           0.102564
tout            0.094849
transport       0.080706
commun          0.071690
Name: solutions, dtype: float32

communaute


communaute       1.000000
agglomeration    0.332500
communes         0.181365
commune          0.125479
departement      0.061793
region           0.045552
constructeurs    0.000000
pistes           0.000000
bus              0.000000
demande          0.000000
Name: communaute, dtype: float32

faire


faire            1.000000
faut             0.162316
voiture          0.158921
tout             0.132461
solutions        0.095789
commun           0.076923
transports       0.072930
transport        0.071248
entreprises      0.048135
collectivites    0.022938
Name: faire, dtype: float32

departements


departements     1.000000
regions          0.248308
communes         0.123059
constructeurs    0.000000
public           0.000000
demande          0.000000
tout             0.000000
travail          0.000000
moyens           0.000000
commune          0.000000
Name: departements, dtype: float32

tous


tous             1.000000
transports       0.052328
entreprises      0.045967
collectivites    0.021396
public           0.000000
demande          0.000000
tout             0.000000
travail          0.000000
moyens           0.000000
commune          0.000000
Name: tous, dtype: float32

In [87]:
for i in df_qu_14_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_14[i].sort_values(ascending=False).head(10))

collectivites


collectivites    0.000193
territoriales    0.000184
locales          0.000165
associations     0.000053
entreprises      0.000042
citoyens         0.000041
privees          0.000036
solutions        0.000032
transports       0.000031
place            0.000030
Name: collectivites, dtype: float32

region


region              0.000195
departement         0.000088
commune             0.000055
ville               0.000046
intercommunalite    0.000046
communaute          0.000039
niveau              0.000038
bus                 0.000031
sncf                0.000028
transports          0.000028
Name: region, dtype: float32

departement


departement         0.000290
region              0.000088
commune             0.000076
communaute          0.000053
intercommunalite    0.000052
ville               0.000047
mairie              0.000040
communes            0.000032
transport           0.000027
commun              0.000024
Name: departement, dtype: float32

communes


communes        0.000293
communautes     0.000214
communaute      0.000156
departements    0.000123
regions         0.000087
departement     0.000032
transport       0.000031
transports      0.000030
solutions       0.000027
commun          0.000027
Name: communes, dtype: float32

commune


commune             0.000319
communaute          0.000108
departement         0.000076
intercommunalite    0.000062
region              0.000055
transport           0.000026
commun              0.000024
transports          0.000022
communes            0.000018
voir                     NaN
Name: commune, dtype: float32

locales


locales          0.000369
collectivites    0.000165
solutions        0.000039
entreprises      0.000036
transports       0.000026
transport        0.000026
commun           0.000024
regions          0.000020
communes         0.000013
departement      0.000011
Name: locales, dtype: float32

transports


transports       0.000412
commun           0.000292
developpement    0.000150
covoiturage      0.000149
demande          0.000141
charge           0.000131
developper       0.000124
train            0.000116
velo             0.000115
bus              0.000103
Name: transports, dtype: float32

entreprises


entreprises     0.000434
privees         0.000224
associations    0.000084
monde           0.000081
citoyens        0.000061
tout            0.000058
solutions       0.000054
transport       0.000053
tous            0.000049
faire           0.000043
Name: entreprises, dtype: float32

regions


regions         0.000521
departements    0.000248
villes          0.000093
communes        0.000087
mairies         0.000064
transports      0.000041
transport       0.000037
commun          0.000034
entreprises     0.000023
locales         0.000020
Name: regions, dtype: float32

commun


commun         0.000523
transports     0.000292
transport      0.000215
covoiturage    0.000202
demande        0.000171
velo           0.000152
developper     0.000138
pistes         0.000117
cyclables      0.000112
voiture        0.000110
Name: commun, dtype: float32

transport


transport      0.000631
demande        0.000387
commun         0.000215
covoiturage    0.000141
societes       0.000131
bus            0.000120
velo           0.000116
service        0.000116
voiture        0.000115
place          0.000108
Name: transport, dtype: float32

territoriales


territoriales    0.000672
collectivites    0.000184
entreprises      0.000034
transports       0.000030
voir                  NaN
locaux                NaN
mettre                NaN
publiques             NaN
territoire            NaN
mairies               NaN
Name: territoriales, dtype: float32

mairie


mairie         0.000754
departement    0.000040
region         0.000027
voir                NaN
locaux              NaN
mettre              NaN
publiques           NaN
territoire          NaN
mairies             NaN
pouvoirs            NaN
Name: mairie, dtype: float32

ville


ville          0.000797
commun         0.000054
transports     0.000052
departement    0.000047
region         0.000046
voir                NaN
locaux              NaN
mettre              NaN
publiques           NaN
territoire          NaN
Name: ville, dtype: float32

tout


tout           0.000818
monde          0.000684
voiture        0.000141
faut           0.000118
faire          0.000117
solutions      0.000078
entreprises    0.000058
commun         0.000057
transports     0.000056
transport      0.000054
Name: tout, dtype: float32

solutions


solutions       0.000826
alternatives    0.000577
proposer        0.000291
place           0.000146
mettre          0.000141
faut            0.000108
faire           0.000085
tout            0.000078
transport       0.000067
commun          0.000059
Name: solutions, dtype: float32

communaute


communaute       0.000858
agglomeration    0.000285
communes         0.000156
commune          0.000108
departement      0.000053
region           0.000039
voir                  NaN
locaux                NaN
mettre                NaN
publiques             NaN
Name: communaute, dtype: float32

faire


faire            0.000884
faut             0.000144
voiture          0.000141
tout             0.000117
solutions        0.000085
commun           0.000068
transports       0.000064
transport        0.000063
entreprises      0.000043
collectivites    0.000020
Name: faire, dtype: float32

departements


departements    0.000998
regions         0.000248
communes        0.000123
voir                 NaN
locaux               NaN
mettre               NaN
publiques            NaN
territoire           NaN
mairies              NaN
pouvoirs             NaN
Name: departements, dtype: float32

tous


tous             0.001071
transports       0.000056
entreprises      0.000049
collectivites    0.000023
voir                  NaN
locaux                NaN
mettre                NaN
publiques             NaN
territoire            NaN
mairies               NaN
Name: tous, dtype: float32

In [88]:
gc.collect()

147

# Question 15 :  Que pourrait faire la France pour faire partager ses choix en matière d'environnement au niveau européen et international ?

In [89]:
question_15 = "Que pourrait faire la France pour faire partager ses choix en matière d'environnement au niveau européen et international ?"
qu_15,df_qu_15_one_hot,df_cov_15,df_confidence_15,df_lift_15 = compute_similarities(question_15, new_res)

In [90]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_15[i].sort_values(ascending=False).head(10))

exemple


exemple       9118
montrer       4482
donner        1987
pays          1816
france        1385
faire         1359
tout           600
prendre        594
ecologique     564
niveau         559
Name: exemple, dtype: uint16

pays


pays             7776
france           2144
exemple          1816
faire            1702
europe           1119
europeens         937
montrer           851
niveau            847
tous              821
environnement     818
Name: pays, dtype: uint16

faire


faire       6111
pays        1702
france      1524
exemple     1359
choix        986
montrer      801
europe       789
niveau       741
faut         682
europeen     647
Name: faire, dtype: uint16

france


france           6055
pays             2144
faire            1524
exemple          1385
choix             979
europe            965
niveau            766
environnement     734
faut              681
matiere           657
Name: france, dtype: uint16

montrer


montrer          5570
exemple          4482
pays              851
faire             801
france            630
ecologique        368
tout              355
environnement     324
faut              309
choix             291
Name: montrer, dtype: uint16

europe


europe      3436
pays        1119
france       965
faire        789
exemple      558
niveau       508
europeen     413
faut         393
tous         347
tout         339
Name: europe, dtype: uint16

niveau


niveau           3079
europeen         1717
pays              847
france            766
faire             741
international     576
exemple           559
europe            508
environnement     419
produits          375
Name: niveau, dtype: uint16

europeen


europeen         3027
niveau           1717
pays              770
faire             647
france            626
exemple           450
environnement     419
europe            413
international     396
produits          385
Name: europeen, dtype: uint16

donner


donner     2857
exemple    1987
lecons      640
pays        561
france      498
faire       412
montrer     244
europe      172
monde       171
tout        169
Name: donner, dtype: uint16

choix


choix            2718
faire             986
france            979
pays              754
partager          624
exemple           533
environnement     398
matiere           324
niveau            309
faut              293
Name: choix, dtype: uint16

produits


produits         2674
taxer             888
pays              746
france            518
environnement     472
importes          440
exemple           420
faire             394
europeen          385
niveau            375
Name: produits, dtype: uint16

environnement


environnement    2630
pays              818
france            734
matiere           599
faire             563
exemple           549
produits          472
niveau            419
europeen          419
choix             398
Name: environnement, dtype: uint16

ecologique


ecologique    2329
transition     996
pays           738
france         566
exemple        564
faire          499
europeen       371
montrer        368
niveau         332
politique      319
Name: ecologique, dtype: uint16

tout


tout       2204
pays        669
france      625
exemple     600
faire       590
monde       450
montrer     355
europe      339
faut        318
niveau      251
Name: tout, dtype: uint16

faut


faut       2142
pays        709
faire       682
france      681
exemple     542
europe      393
niveau      330
tout        318
montrer     309
choix       293
Name: faut, dtype: uint16

tous


tous             2118
pays              821
faire             526
france            467
exemple           439
europe            347
produits          326
niveau            280
environnement     250
faut              249
Name: tous, dtype: uint16

mettre


mettre      2054
place        834
pays         607
faire        440
exemple      410
france       394
niveau       314
europeen     272
europe       260
montrer      254
Name: mettre, dtype: uint16

taxer


taxer            2022
produits          888
pays              548
france            337
importations      271
faire             270
exemple           263
environnement     252
non               208
pollueurs         196
Name: taxer, dtype: uint16

politique


politique        1925
pays              482
exemple           419
france            399
faire             375
ecologique        319
niveau            317
europeen          309
environnement     302
europe            298
Name: politique, dtype: uint16

europeens


europeens      1838
pays            937
france          501
faire           404
exemple         388
europe          277
niveau          251
tous            241
europeen        217
partenaires     200
Name: europeens, dtype: uint16

In [91]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_15[i].sort_values(ascending=False).head(10))

exemple


exemple      1.000000
montrer      0.804668
donner       0.695485
nordiques    0.431487
attendre     0.427208
prendre      0.420382
discours     0.413793
loin         0.397229
commencer    0.374656
devenir      0.366450
Name: exemple, dtype: float32

pays


pays         1.000000
nordiques    0.956268
nord         0.730887
avance       0.688442
inspirer     0.604131
europeens    0.509793
rapport      0.501529
membres      0.496063
efforts      0.494983
retard       0.488525
Name: pays, dtype: float32

faire


faire           1.000000
savoir          0.696113
payer           0.659864
preuve          0.564885
pression        0.537705
choses          0.484848
partager        0.471837
efforts         0.434783
lecon           0.427451
propositions    0.405594
Name: faire, dtype: float32

france


france      1.000000
retard      0.544262
nord        0.428135
matiere     0.406559
rapport     0.403670
partager    0.398367
produit     0.372603
loin        0.371824
poids       0.363825
faudrait    0.362235
Name: france, dtype: float32

montrer


montrer       1.000000
exemple       0.491555
fonctionne    0.379310
marche        0.305233
attendre      0.303103
resultats     0.290780
economie      0.252577
leader        0.219616
vie           0.204120
cas           0.203252
Name: montrer, dtype: float32

europe


europe           1.000000
nord             0.529052
regles           0.264120
poids            0.212058
chine            0.209078
etats            0.207071
monde            0.204198
energetique      0.198934
international    0.189266
pouvoir          0.187166
Name: europe, dtype: float32

niveau


niveau           1.000000
national         0.586288
europeen         0.567228
mondial          0.551471
international    0.542373
adopter          0.343849
faveur           0.340000
protection       0.318605
commune          0.293103
reduire          0.241379
Name: niveau, dtype: float32

europeen


europeen         1.000000
parlement        0.868902
niveau           0.557649
international    0.372881
adopter          0.365931
faveur           0.353333
mondial          0.349265
plan             0.309553
protection       0.304651
commune          0.295259
Name: europeen, dtype: float32

donner


donner        1.000000
lecons        0.816327
lecon         0.462745
vouloir       0.277512
exemple       0.217921
commencer     0.154270
arreter       0.112333
monde         0.108779
matiere       0.094678
transition    0.084734
Name: donner, dtype: float32

choix


choix            1.000000
bons             0.568106
partager         0.509388
faudrait         0.259152
matiere          0.200495
france           0.161685
faire            0.161348
question         0.160000
environnement    0.151331
imposer          0.147216
Name: choix, dtype: float32

produits


produits       1.000000
importes       0.973451
importation    0.698529
respectent     0.529148
respectant     0.528947
polluants      0.505112
normes         0.466921
taxer          0.439169
agricole       0.433460
bio            0.417943
Name: produits, dtype: float32

environnement


environnement    1.000000
protection       0.672093
faveur           0.623333
respect          0.433333
agricole         0.395437
matiere          0.370668
adopter          0.328076
sante            0.284916
respectent       0.257848
commune          0.252155
Name: environnement, dtype: float32

ecologique


ecologique       1.000000
transition       0.669805
economique       0.212828
economie         0.178694
plan             0.177751
politique        0.165714
creer            0.164627
taxe             0.162791
modele           0.151125
developpement    0.145610
Name: ecologique, dtype: float32

tout


tout         1.000000
monde        0.286260
accord       0.161342
planete      0.150376
faut         0.148459
francais     0.139367
arreter      0.120974
non          0.116425
nucleaire    0.113222
tous         0.112370
Name: tout, dtype: float32

faut


faut          1.000000
changer       0.174359
planete       0.154135
agir          0.153614
monde         0.152036
economique    0.150146
tout          0.144283
francais      0.134842
etats         0.128283
partager      0.120000
Name: faut, dtype: float32

tous


tous          1.000000
planete       0.177945
interdire     0.159494
citoyens      0.147316
etats         0.144444
monde         0.132316
europeens     0.131121
pollution     0.131043
francais      0.130317
production    0.127582
Name: tous, dtype: float32

mettre


mettre        1.000000
place         0.560107
oeuvre        0.552402
accord        0.209265
taxe          0.143965
solutions     0.135593
production    0.122722
faut          0.109711
ecologie      0.108804
transition    0.108272
Name: mettre, dtype: float32

taxer


taxer           1.000000
importations    0.516190
fortement       0.496350
importes        0.420354
etrangers       0.412195
respectent      0.401345
produits        0.332087
polluants       0.292434
respectant      0.289474
camions         0.280000
Name: taxer, dtype: float32

politique


politique           1.000000
commune             0.642241
agricole            0.532319
vraie               0.524917
environnementale    0.442149
faveur              0.376667
adopter             0.318612
protection          0.267442
energetique         0.223801
europeenne          0.179366
Name: politique, dtype: float32

europeens


europeens      1.000000
partenaires    0.361664
voisins        0.211129
etats          0.121212
pays           0.120499
allemagne      0.116379
tous           0.113787
convaincre     0.111209
francais       0.105882
proposer       0.103933
Name: europeens, dtype: float32

In [92]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_15[i].sort_values(ascending=False).head(10))

exemple


exemple      0.000110
montrer      0.000088
donner       0.000076
nordiques    0.000047
attendre     0.000047
prendre      0.000046
discours     0.000045
loin         0.000044
commencer    0.000041
devenir      0.000040
Name: exemple, dtype: float32

pays


pays         0.000129
nordiques    0.000123
nord         0.000094
avance       0.000089
inspirer     0.000078
europeens    0.000066
rapport      0.000064
membres      0.000064
efforts      0.000064
retard       0.000063
Name: pays, dtype: float32

faire


faire           0.000164
savoir          0.000114
payer           0.000108
preuve          0.000092
pression        0.000088
choses          0.000079
partager        0.000077
efforts         0.000071
lecon           0.000070
propositions    0.000066
Name: faire, dtype: float32

france


france      0.000165
retard      0.000090
nord        0.000071
matiere     0.000067
rapport     0.000067
partager    0.000066
produit     0.000062
loin        0.000061
poids       0.000060
faudrait    0.000060
Name: france, dtype: float32

montrer


montrer       0.000180
exemple       0.000088
fonctionne    0.000068
marche        0.000055
attendre      0.000054
resultats     0.000052
economie      0.000045
leader        0.000039
vie           0.000037
cas           0.000036
Name: montrer, dtype: float32

europe


europe           0.000291
nord             0.000154
regles           0.000077
poids            0.000062
chine            0.000061
etats            0.000060
monde            0.000059
energetique      0.000058
international    0.000055
pouvoir          0.000054
Name: europe, dtype: float32

niveau


niveau           0.000325
national         0.000190
europeen         0.000184
mondial          0.000179
international    0.000176
adopter          0.000112
faveur           0.000110
protection       0.000103
commune          0.000095
reduire          0.000078
Name: niveau, dtype: float32

europeen


europeen         0.000330
parlement        0.000287
niveau           0.000184
international    0.000123
adopter          0.000121
faveur           0.000117
mondial          0.000115
plan             0.000102
protection       0.000101
commune          0.000098
Name: europeen, dtype: float32

donner


donner        0.000350
lecons        0.000286
lecon         0.000162
vouloir       0.000097
exemple       0.000076
commencer     0.000054
arreter       0.000039
monde         0.000038
matiere       0.000033
transition    0.000030
Name: donner, dtype: float32

choix


choix            0.000368
bons             0.000209
partager         0.000187
faudrait         0.000095
matiere          0.000074
france           0.000059
faire            0.000059
question         0.000059
environnement    0.000056
imposer          0.000054
Name: choix, dtype: float32

produits


produits       0.000374
importes       0.000364
importation    0.000261
respectent     0.000198
respectant     0.000198
polluants      0.000189
normes         0.000175
taxer          0.000164
agricole       0.000162
bio            0.000156
Name: produits, dtype: float32

environnement


environnement    0.000380
protection       0.000256
faveur           0.000237
respect          0.000165
agricole         0.000150
matiere          0.000141
adopter          0.000125
sante            0.000108
respectent       0.000098
commune          0.000096
Name: environnement, dtype: float32

ecologique


ecologique       0.000429
transition       0.000288
economique       0.000091
economie         0.000077
plan             0.000076
politique        0.000071
creer            0.000071
taxe             0.000070
modele           0.000065
developpement    0.000063
Name: ecologique, dtype: float32

tout


tout         0.000454
monde        0.000130
accord       0.000073
planete      0.000068
faut         0.000067
francais     0.000063
arreter      0.000055
non          0.000053
nucleaire    0.000051
tous         0.000051
Name: tout, dtype: float32

faut


faut          0.000467
changer       0.000081
planete       0.000072
agir          0.000072
monde         0.000071
economique    0.000070
tout          0.000067
francais      0.000063
etats         0.000060
partager      0.000056
Name: faut, dtype: float32

tous


tous          0.000472
planete       0.000084
interdire     0.000075
citoyens      0.000070
etats         0.000068
monde         0.000062
europeens     0.000062
pollution     0.000062
francais      0.000062
production    0.000060
Name: tous, dtype: float32

mettre


mettre        0.000487
place         0.000273
oeuvre        0.000269
accord        0.000102
taxe          0.000070
solutions     0.000066
production    0.000060
faut          0.000053
ecologie      0.000053
transition    0.000053
Name: mettre, dtype: float32

taxer


taxer           0.000495
importations    0.000255
fortement       0.000245
importes        0.000208
etrangers       0.000204
respectent      0.000198
produits        0.000164
polluants       0.000145
respectant      0.000143
camions         0.000138
Name: taxer, dtype: float32

politique


politique           0.000519
commune             0.000334
agricole            0.000277
vraie               0.000273
environnementale    0.000230
faveur              0.000196
adopter             0.000166
protection          0.000139
energetique         0.000116
europeenne          0.000093
Name: politique, dtype: float32

europeens


europeens      0.000544
partenaires    0.000197
voisins        0.000115
etats          0.000066
pays           0.000066
allemagne      0.000063
tous           0.000062
convaincre     0.000061
francais       0.000058
proposer       0.000057
Name: europeens, dtype: float32

In [None]:
gc.collect()

105

# Question 16 :   Y a-t-il d'autres points sur la transition écologique sur lesquels vous souhaiteriez vous exprimer ?

In [None]:
question_15 = "Y a-t-il d'autres points sur la transition écologique sur lesquels vous souhaiteriez vous exprimer ?"
qu_15,df_qu_15_one_hot,df_cov_15,df_confidence_15,df_lift_15 = compute_similarities(question_15, new_res)

In [None]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_cov_15[i].sort_values(ascending=False).head(10))

In [None]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_confidence_15[i].sort_values(ascending=False).head(10))

In [None]:
for i in df_qu_15_one_hot.sum(axis=0).sort_values(ascending=False).head(20).index:
    print(i)
    display(df_lift_15[i].sort_values(ascending=False).head(10))

In [None]:
gc.collect()