# Construire des wordcloud basés sur deux années différentes de bulletins

## Créer un fichier contenant les bulletins de l'année 1880

In [1]:
#Choisir une année

YEAR = 1882

In [2]:
# Lister les fichiers de cette année

from os import listdir
from os.path import isfile, join

data_path = '../data'
txt_path = '../data/txt'
txts = [f for f in listdir(txt_path) if isfile(join(txt_path, f)) and str(YEAR) in f]
txts

['Bxl_1882_Tome_I1_Part_1.txt',
 'Bxl_1882_Tome_I1_Part_2.txt',
 'Bxl_1882_Tome_I1_Part_3.txt',
 'Bxl_1882_Tome_I1_Part_4.txt',
 'Bxl_1882_Tome_I1_Part_5.txt',
 'Bxl_1882_Tome_I1_Part_6.txt',
 'Bxl_1882_Tome_I1_Part_7.txt',
 'Bxl_1882_Tome_I2_Part_1.txt',
 'Bxl_1882_Tome_I2_Part_10.txt',
 'Bxl_1882_Tome_I2_Part_11.txt',
 'Bxl_1882_Tome_I2_Part_12.txt',
 'Bxl_1882_Tome_I2_Part_13.txt',
 'Bxl_1882_Tome_I2_Part_2.txt',
 'Bxl_1882_Tome_I2_Part_3.txt',
 'Bxl_1882_Tome_I2_Part_4.txt',
 'Bxl_1882_Tome_I2_Part_5.txt',
 'Bxl_1882_Tome_I2_Part_6.txt',
 'Bxl_1882_Tome_I2_Part_7.txt',
 'Bxl_1882_Tome_I2_Part_8.txt',
 'Bxl_1882_Tome_I2_Part_9.txt',
 'Lkn_1882_Tome_I_Part_1.txt',
 'Lkn_1882_Tome_I_Part_2.txt',
 'Lkn_1882_Tome_I_Part_3.txt',
 'Lkn_1882_Tome_I_Part_4.txt',
 'Lkn_1882_Tome_I_Part_5.txt',
 'Lkn_1882_Tome_RptAn_Part_1.txt',
 'Lkn_1882_Tome_RptAn_Part_2.txt',
 'Lkn_1882_Tome_RptAn_Part_3.txt',
 'Lkn_1882_Tome_RptAn_Part_4.txt',
 'Lkn_1882_Tome_RptAn_Part_5.txt',
 'Lkn_1882_Tome_RptAn_Part

In [3]:
# Stocker le contenu de ces fichiers dans une liste

content_list = []
for txt in txts:
    with open(f'{txt_path}/{txt}', encoding='utf-8') as f:
        content_list.append(f.read())

In [4]:
# Ecrire tout le contenu dans un fichier

with open(f'tmp/{YEAR}.txt', 'w', encoding='utf-8') as f:
    f.write(' '.join(content_list))

## Enlever les stopwords, les mots courts et non alphabétiques et stocker le résultat dans un nouveau fichier

In [5]:
# Imprimer le contenu du fichier et constater les "déchets"

with open(f'tmp/{YEAR}.txt', 'r', encoding='utf-8') as f:
    before = f.read()

before[:500]

'BULLETIN\n\nCOMMUNAL\n\n. ANNÉE\n\nPREMIÈRE\n\nTOME\n\nCOMPTE\n\nRENDU\n\n1882.\n\nPARTIE.\n\nI\n\nDES\n\nSÉANCES,\n\nBRUXELLES\nIMPRIMERIE D E V\n\nV E\n\nJULIEN\n\nBAERTSOEN, SUOC* D E\n\n18 82\n\nBOLS-WITTOUCK.\n\n\x0c\x0cN° I.\n\nCOMPTE RENDU DE LA SÉANCE DU 1\n\nVILLE\n\nD E\n\ner\n\nJANVIER 1882.\n\nBRUXELLES.\n\nBULLETIN C O M M U N A L\nÎANNÉE\n\nC O N S E I L\nSéance\n\n1882.\n\nC O M M U N A L .\ndu 1 janvier\n\nPrésidence de\n\ner\n\nM.\n\nBULS,\n\n1882.\n\nBourgmestre.\n\nSOMMAIRE :\n\nEchevias. — Prestation de serment.\nConseillers communaux. — Id.\nReceveur commun'

In [6]:
# Appliquer la fonction filtering (que vous pouvez customiser)

from filtering import filtering

filtering(YEAR, folder='tmp')

'Output has been written in tmp/1882_keywords.txt!'

In [7]:
# Vérifier le résultat

with open(f'tmp/{YEAR}_keywords.txt', 'r', encoding='utf-8') as f:
    after = f.read()

after[:500]

'bulletin communal année première tome compte rendu partie séances bruxelles imprimerie julien baertsoen suoc bols wittouck compte rendu séance janvier bruxelles bulletin îannée séance janvier présidence buls bourgmestre sommaire echevias prestation serment conseillers communaux receveur communal conseil communal composition sections interpellation pilloy séance ouverte mid présents buis bourgmestre eau walravens andré echevins becquet faisant fonctions echevin godefroy dcpaire veldekens guillery'

## Créer le word cloud

In [None]:
import subprocess

command = [
    'wordcloud_cli',
    '--text', f'tmp/{YEAR}_keywords.txt',
    '--imagefile', f'tmp/{YEAR}.png',
    '--width', '2000',
    '--height', '1000',
]

subprocess.run(command, capture_output=True)

## Afficher le word cloud

In [None]:
from IPython.display import Image

Image(filename=f'tmp/{YEAR}.png')

## Créer un fichier contenant les bulletins de l'année 1960

In [8]:
#Choisir une année

YEAR = 1960

In [9]:
# Lister les fichiers de cette année

from os import listdir
from os.path import isfile, join

data_path = '../data'
txt_path = '../data/txt'
txts = [f for f in listdir(txt_path) if isfile(join(txt_path, f)) and str(YEAR) in f]
txts

['Bxl_1960_Tome_II1_Part_1.txt',
 'Bxl_1960_Tome_II1_Part_2.txt',
 'Bxl_1960_Tome_II1_Part_3.txt',
 'Bxl_1960_Tome_II1_Part_4.txt',
 'Bxl_1960_Tome_II1_Part_5.txt',
 'Bxl_1960_Tome_II1_Part_6.txt',
 'Bxl_1960_Tome_II1_Part_7.txt',
 'Bxl_1960_Tome_II1_Part_8.txt',
 'Bxl_1960_Tome_II2_Part_1.txt',
 'Bxl_1960_Tome_II2_Part_2.txt',
 'Bxl_1960_Tome_II2_Part_3.txt',
 'Bxl_1960_Tome_II2_Part_4.txt',
 'Bxl_1960_Tome_II2_Part_5.txt',
 'Bxl_1960_Tome_II2_Part_6.txt',
 'Bxl_1960_Tome_II2_Part_7.txt',
 'Bxl_1960_Tome_II2_Part_8.txt',
 'Bxl_1960_Tome_II2_Part_9.txt',
 'Bxl_1960_Tome_I_Part_1.txt',
 'Bxl_1960_Tome_I_Part_10.txt',
 'Bxl_1960_Tome_I_Part_11.txt',
 'Bxl_1960_Tome_I_Part_12.txt',
 'Bxl_1960_Tome_I_Part_13.txt',
 'Bxl_1960_Tome_I_Part_2.txt',
 'Bxl_1960_Tome_I_Part_3.txt',
 'Bxl_1960_Tome_I_Part_4.txt',
 'Bxl_1960_Tome_I_Part_5.txt',
 'Bxl_1960_Tome_I_Part_6.txt',
 'Bxl_1960_Tome_I_Part_7.txt',
 'Bxl_1960_Tome_I_Part_8.txt',
 'Bxl_1960_Tome_I_Part_9.txt',
 'Bxl_1960_Tome_RptAn_Part_1.txt

In [10]:
# Stocker le contenu de ces fichiers dans une liste

content_list = []
for txt in txts:
    with open(f'{txt_path}/{txt}', encoding='utf-8') as f:
        content_list.append(f.read())

In [11]:
# Ecrire tout le contenu dans un fichier

with open(f'tmp/{YEAR}.txt', 'w', encoding='utf-8') as f:
    f.write(' '.join(content_list))

## Enlever les stopwords, les mots courts et non alphabétiques et stocker le résultat dans un nouveau fichier

In [12]:
# Imprimer le contenu du fichier et constater les "déchets"

with open(f'tmp/{YEAR}.txt', 'r', encoding='utf-8') as f:
    before = f.read()

before[:500]

'PUBLICATION\n\nPERIODIQUE\n\nVILLE DE BRUXELLES\n\nAnnée 1960\n\nBULLETIN\nCOMMUNAL\nTOME II "\n_u\n\nImpr. H . 6 M . S C H A U M A N S\nSociété\n\nAnonyme\n\nParvis Saint-Gilles, 41\nBruxelles\n1960\n\n\x0c\x0cN" 14\n\nCOMPTE\n\nR E N D U D E L A S E A N C E D U 1"\' A O U T\n\nVILLE\n\nDE\n\n1960\n\nBRUXELLES\n\nBULLETIN\n\nCOMMUNAL\n\n(Publication\n\npériodique)\n\nA n n é e 1960\n\nCONSEIL\n\nS é a n c e du\n\nPRESIDENCE\n\nCOMMUNAL\n\n1\n\ner\n\naoût\n\nDE M .\n\n1960.\n\nCOOREMANS,\n\nBourgmestre.\n\nSOMMAIRE :\nPages\n1.\n\n2.\n\n3.\n\n4.\n\nEvénements tragiques du Congo.'

In [13]:
# Appliquer la fonction filtering (que vous pouvez customiser)

from filtering import filtering

filtering(YEAR, folder='tmp')

'Output has been written in tmp/1960_keywords.txt!'

In [14]:
# Vérifier le résultat

with open(f'tmp/{YEAR}_keywords.txt', 'r', encoding='utf-8') as f:
    after = f.read()

after[:500]

'publication periodique bruxelles année bulletin communal tome impr société anonyme parvis saint gilles bruxelles compte bruxelles bulletin communal publication périodique conseil presidence communal août cooremans bourgmestre sommaire pages evénements tragiques congo vote crédit extraordinaire faveur rapatriéa congo sports avant projet construction bâtiment vestiaire installation éclairage électrique stade annexe heysel académie royale beaux arts construction escalier béton devis projets montant'

## Créer le word cloud

In [None]:
import subprocess

command = [
    'wordcloud_cli',
    '--text', f'tmp/{YEAR}_keywords.txt',
    '--imagefile', f'tmp/{YEAR}.png',
    '--width', '2000',
    '--height', '1000',
]

subprocess.run(command, capture_output=True)

## Afficher le word cloud

In [None]:
from IPython.display import Image

Image(filename=f'tmp/{YEAR}.png')