# Similarity search

In [4]:
import re
import pandas as pd
import numpy as np
from tqdm import tqdm
from sklearn.svm import SVC
from keras.models import Sequential
from keras.layers.recurrent import LSTM, GRU
from keras.layers.core import Dense, Activation, Dropout
from keras.layers.embeddings import Embedding
from keras.layers.normalization import BatchNormalization
from keras.utils import np_utils
from sklearn import preprocessing, decomposition, model_selection, metrics, pipeline
from sklearn.model_selection import GridSearchCV
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer
from sklearn.decomposition import TruncatedSVD
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from keras.layers import GlobalMaxPooling1D, Conv1D, MaxPooling1D, Flatten, Bidirectional, SpatialDropout1D
from keras.preprocessing import sequence, text
from keras.callbacks import EarlyStopping
import nltk
from nltk import word_tokenize
from nltk.corpus import stopwords
import qgrid

import sys
sys.path.insert(0, "..")

### Read preprocessed text

In [36]:
df = pd.read_csv("cleaned_df.csv")
df = df[["Unnamed: 0", "Unnamed: 0_x", 'text_clean', "text_no_point", 'article_name', 'count']]
df.dropna(inplace=True)
df = df.sort_values(by=['count'], ascending=False)

<class 'pandas.core.frame.DataFrame'>
Int64Index: 34065 entries, 0 to 135906
Data columns (total 6 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Unnamed: 0     34065 non-null  int64 
 1   Unnamed: 0_x   34065 non-null  int64 
 2   text_clean     34065 non-null  object
 3   text_no_point  34065 non-null  object
 4   article_name   34065 non-null  object
 5   count          34065 non-null  int64 
dtypes: int64(3), object(3)
memory usage: 1.8+ MB


In [34]:
# Read labelled test df
#df.to_csv("merge.csv")
label = df[:300].copy()
label = label[['text_clean', "Unnamed: 0"]]
label.rename(columns={'text_clean': 'text', 'Unnamed: 0': 'index'}, inplace=True)
label.to_csv("to_annotate.csv")

### After manually annotating text

In [5]:
train = pd.read_csv("result.csv")

### TF-IDF similarity

In [6]:
# Spliting into X & y
#X = train.iloc[:, 2].values # to get th
X = train["text_wop_clean"].values # to get th

# Convert label to numeric
cleanup_label = {"sentiment": {"Ja": 1, "Nee": 0}}
train.replace(cleanup_label, inplace=True)
y = train.sentiment.values

In [7]:
# Split train and validation
from sklearn.model_selection import train_test_split
xtrain, xvalid, ytrain, yvalid = train_test_split(X, y, 
                                                  stratify=y, 
                                                  random_state=42, 
                                                  test_size=0.1, shuffle=True)

In [8]:
# Create TF-IDF
tfv = TfidfVectorizer(min_df=3, max_features=None,
                      strip_accents='unicode', analyzer='word',token_pattern=r'\w{1,}',
                      ngram_range=(1, 2), use_idf=1,smooth_idf=1,sublinear_tf=1)

# Fitting TF-IDF to both training and test sets (semi-supervised learning)
tfv.fit(list(xtrain) + list(xvalid))
xtrain_tfv = tfv.transform(xtrain)
xvalid_tfv = tfv.transform(xvalid)

#X_arr = td.fit_transform(X).toarray()

In [12]:
# Training the classifier & predicting on test data
clf = MultinomialNB()
clf.fit(xtrain_tfv, ytrain)
yvalid_pred = clf.predict(xvalid_tfv)

In [13]:
# Classification metrics
from sklearn.metrics import accuracy_score, classification_report
classification_report = classification_report(yvalid, yvalid_pred)

print('\n Accuracy: ', accuracy_score(yvalid, yvalid_pred))
print('\nClassification Report')
print('======================================================')
print('\n', classification_report)


 Accuracy:  0.8571428571428571

Classification Report

               precision    recall  f1-score   support

           0       1.00      0.80      0.89         5
           1       0.67      1.00      0.80         2

    accuracy                           0.86         7
   macro avg       0.83      0.90      0.84         7
weighted avg       0.90      0.86      0.86         7



In [14]:
# Load the previous dataset for testing
test = pd.read_csv("df_to_label.csv")
test.rename(columns={"label":"sentiment"}, inplace=True)
test["sentiment"] = None

In [15]:
# Select only new rows and not the training set
test_df = test.loc[~test.index.isin(train.index)]

In [16]:
# Predict on new values
test = test_df["text_wop_clean"].values
xtest_tfv = tfv.transform(test)
y_test = clf.predict(xtest_tfv)

In [17]:
# Add prediction to df
test_df["sentiment"] = y_test

In [25]:
# Display, seems to work decently
pd.set_option('display.max_colwidth', None) 
test_df[["text", "sentiment"]].head(100)

Unnamed: 0,text,sentiment
68,"ROTTERDAM — Een grensconflict' tussen Nederland en België is er de oorzaak van dat kapitein Stelian Georghe Guna (60) als gezagvoerder van het Roemeense vrachtschip Borcea niet kan worden vervolgd voor het lozen van olie in Nederlandse territoriale wateren. Officier van Justitie mr. H. A. C. Smid was daarom gisteren voor de Rotterdamse rechtbank gedwongen voor de voornaamste aanklacht tegen de kapitein vrijspraak te bepleiten. Omdat ook van de aanklacht dat de kapitein had verzuimd de autoriteiten van zijn oliespoor op de hoogte te stellen, om juridischtechnische reden niets overbleef, moest mr. Smid zich inhouden. Hij eiste zes maanden gevangenisstraf voor het lozen van olie in Nederlandse (binnen)wateren en het toebrengen van pijn en letsel aan grote aantallen zeevogels als gevolg van de olielozing en het niet melden ervan. De rechtszaak tegen de kapitein werd overigens bij verstek behandeld. Mr. Smid achtte op grond van het proces-verbaal voldoende bewezen dat de Borcea op 4 en 5 januari 1988 olie heeft geloosd als gevolg van een aanvaring met vermoedelijk een wrak. Die aanvaring heeft naar alle waarschijnlijkheid plaats gehad voor de Belgische kust, maar de Borcea heeft op weg naar de Westerschelde, formeel Nederlands grondgebied, hooguit een vijf kilometer in Nederlandse wateren gevaren. Volgens mr. Smid is onvoldoende komen vast te staan dat de Borcea ook daar olie heeft geloosd. De plaats waar de Borcea precies lek raakte is nooit vastgesteld. Toen het schip in het Noorse Haugesund in dok lag is in het gat in bakboord tank 35 een deel van een knevel van vermoedelijk een patrijspoort gevonden. Duikers van de Belgische zeemacht hebben gedoken naar een wrak op de route die de Borcea heeft afgelegd, maar oude visnetten rondom het wrak maken nadere inspectie onmogelijk. Juist het lozen van olie door de Borcea in Nederlandse wateren — de zwaarste aanklacht — kon niet worden bewezen. Dat op de Westerschelde door de vrachtvaarder olie was verloren stond wel vast. Maar, juist die grens tussen zee en binnenwater, bekend als het zeegebied Wielingen, is nog altijd onvoldoende afgebakend. Dat 'grensconflict' met België, waarbij Nederland de Wielingen 'claimt', dateert van het begin van de zestiende eeuw. De Groote Raad van Mechelen oordeelde in 1504 wel dat de Westerschelde een Zeeuwse en dus Hollandse stroom was en dat de grens zou lopen voor de Vlaamse kust en dat het gezag van de Graaf van Vlaanderen zich niet verder zou uitstrekken dan hij in het water wadende kon reiken met het zwaard. Mr. Smid ging er veiligheidshalve van uit dat die uitaspraak wel niet meer zou worden erkend. Het zat de officier van Justitie op meer punten niet mee. In zijn dagvaarding had mr. Smid de Borcea-kapitein verweten het lozen van olie niet aan de autoriteiten te hebben gemeld, zodat geen maatregelen ter voorkoming van grotere milieuschade konden worden getroffen. Volgens het proces-verbaal ontkent de kapitein dat hij van het oplopen van averij iets heeft gemerkt. Maar ook heeft hij verklaard niet te begrijpen waarom hij niets had gemerkt toen hij later de schade waarnam. Mr. Smid stelde voor de rechtbank dat voldoende was vast komen te staan dat de gezagvoerder op de hoogte was van het verliezen van olie. Hij baseerde zich daartoe onder andere op een telegram dat de kapitein in de nacht na het oplopen van de averij aan zijn rederij had gestuurd en waarin hij om een onderzoek door duikers verzocht. Het melden van averij en het lozen van olie moet op grond van het internationale Marpol-verdrag (dat overigens niet door Roemenië is bekrachtigd). Nederland hanteert die plicht ook in de Wet Voorkoming Verontreiniging door Schepen, maar het bijbehorende zogeheten uitvoeringsbesluit is pas op 16 februari vorig jaar (meer dan tien jaar na het opstellen van het Marpol-verdrag en drie jaar na het van kracht worden van de wet) geldig geworden. Ook op dit punt kon de officier van Justitie dus niets meer doen dan vrijspraak vragen. Wat mr. Smid na een meer dat een uur durend requisitoir overhield was het lozen van olie op Nederlandse binnenwateren en het in Nederlandse zee toebrengen van pijn en letsel aan grote aantallen zeevogels als gevolg van de olielozing en het niet melden daarvan. Op de stranden van Cadzand tot en met Texel waren in de tweede week van januari 1988 duizenden dode en zieke vogels aangespoeld. Naar schatting heeft slechts tweeëneenhalf percent van de zieke, met oliebesmeurde vogels de ramp overleefd.' Mr. Smid stelde dat de kapitein 'stommetje' heeft willen spelen met de autoriteiten door de olielozing niet te melden en waardoor de betrokken kuststaten geen adequate maatregelen hebben kunnen treffen om een verdere milieuramp te voorkomen. Het niet-melden kon mr. Smid overigens niet koppelen aan opzettelijke dierenmishandeling, maar strafbaar was het in ieder geval wel. De officier van Justitie karakteriseerde kapitein Guna als iemand „met een volstrekte minachting voor het milieu die ons allen zo dierbaar hoort te zijn"". Volgens de officier is de kapitein zonder iemand te waarschuwen verder gevaren om zich aan de nasporingen van politie en justitie te onttrekken en heeft hij daarbij willens en wetens het risico genomen dat het schip verder zou lozen. Ook pleitte de officier de Roemeense staatsrederij Navrom niet geheel vrij. De radio-officier van de Borcea noemde mr. Smid een 'partijbons die kennelijk toezicht moest houden'. Volgens mr. Smid heeft de rederij de kapitein zelfs aangezet tot valsheid in geschrifte. Hij maakte dat op uit telegrafieverkeer tussen de rederij en het schip. Tijdens huiszoeking aan boord van het schip waren in een prullenbak de telegram-opdrachten teruggevonden. De Rotterdamse rechtbank doet op 26 maart uitspraak.",1
69,"PkJ^.Van Huis Uit Aktief? BRUNSSUM: Goed onderhouden aantrekkelijk haltvrijstaand woonhuis met c.v.-gas, grote garage en diepe achtertuin^ Ind o a^: f ■ KERKRADE-Bleijerheide: provisiekelder, L-vormige woonkamer, eetkeuken, bi|keuken. 4 _^_r_9___^______^^^ Woonhuis met c v -gas berging slaapkamers, badkamer, bergzolder Aanvaarding in overleg ■4fl_PfP_PP|P^_PT en tuin Ind o.a: 2 kelders. Vraagprijs ƒ 159.000- k.k. li. ■B-fs woonkamer-ensuite, keuken. 3 _^*__^__________W__ s_i__W__K____B__l slaapkamers, doucheruimte. g£_mJo_ EYGELSHOVEN: Laurastraat. «7?*''! BS**! M^P! Vaste trap naar de zolder, 2 zolË fllllfl B_a me woning met c.v.-gas, berging Bp|BmH _______] men tuin. Ind. 0.a.: 2 kelders. WlWAAHmW^mmtwi HBIH \^mm woonkamer, keuken. 1e verd.: 3 f ftwmoian ' veroP 2 kamers, zolder Vraag- NIEUWENHAGEN: Goed gerenoveerd ruim tussenwoonhuis met m prijs f 89 000- k.k. c.v.-gas. bergingen, eenvoudige garage en tuin. Ind. 0.a.: 2 kel—mWM ders. betegelde gang, woonkamer, eetkamer, betegelde eetkeu"" . ken, betegelde badkamer 1e verd.: overloop en 3 ruime slaapka- HEERLEN-Bekkerveld: Op loopafstand van het centrum zijn ™ers. 2e verd.: vaste trap. 2 zolderkamers, zolderberging. Pand is 16 royale en luxe appartementen gerealiseerd aan het prachti- geheel voorzien van dubbele beglazing. Aanvaarding n.o.t.k. ge Bekkerveld Parkeergarage in het souterrain. Totale woon- Vraagprijs ƒ 124.000- k.k. oppervlakte variërend van 140 m 2 tot 160 m 2. Optimale veilig- heid en privacy. Ind 0.a.: royale living, compleet - luxe inge- ,- J£m% SCHAESBERG-Centrum: Ruinchte - keuken, twee slaapkamers, twee badkamers, balkon <*___SPSSPW—■■■iMK ""^ hoekwomng met grote in- Nog slechts 2 appartementen te koop met tuin. Koopprijs «M pandige garage klein terras. ƒ 386.000-v.o.n. „Inruil"" van uw eigen woning is mogelijk. Be- ,____ geen tuin. Goed onderhouden, zichtiging na afspraak _i_fl ■ lnd °a : nel Pand is geheel on- HEERLEN-Centrum (Pancratiuskerk) -te huur: Type B (nog I 3»B keuken^ leverd.: 3 slaapka-1 appartement) Grote woonkamer, keuken, twee slaapka- 9 m*!'s• ■,°ad*tmeL,H°,, """"w?^,, mers badkamer, patio. lift. Bruto-opp ca. 115 m 2. Huurprijs ■ S-IMH-il» zolderkamers, zolder. Vraagƒ 1375- per maand inclusief servicekosten Reservering na- EL^B __I_P Pn'S ' bijgelegen parkeerplaats mogelijk ■■^■■sls^ HEERLEN: Gelegen aan de buitenrand van de stad (loopafstand SCHAESBERG: Vrijstaand woonhuis met c.v.-gas, garage en winkelcentrum). Woonhuis met c.v.-gas, berging en tuin Ged. dub- tuin (op 't zuiden). Gelegen nabij een mooi recreatie- en wanbele beglazing Goed onderhouden. Ind oa.: woonkamer met delgebied Bouwjaar 1981. Geheel geïsoleerd, duurzaam afopen haard, keukeninstallatie met apparatuur, 4 slaapkamers, werkingsniveau, goed onderhouden. Ind o.a : L-vormige doucheruimte, zolder Prijs ƒ 89 000- k k woonkamer met travertinvloer, open haard, keuken met een ■ complete keukeninstallatie, bijkeuken, overdekt terras met open haard, 3 slaapkamers, badkamer met o.a ligbad en douche Zolderruimte. Vraagprijs ƒ 317.000- k.k. SCHAESBERG: Rustig en blij- J__^__^_fr-^i vend goed gelegen halfvrij|r*f_fl —__ \ staand woonhuis met cv., gara■Oj ge en tuin (op het zuiden gelemi , gen) Dak is geïsoleerd, ged. __^ dubb beglazing, ged rolluiken. H_ Goed onderhouden Ind. 0.a.: I provisiekelder, woonkamer (ca. ■BiWE ■37 m 2), keuken met een goed uit-—■—3s""^Eb™Hßßst gevoerde keukeninst., bijkeuken, 3 slaapkamers, luxe badkamer, vliering Koopprijs ƒ 149.000-k.k. ÜBACH OVER WORMS-Abdissenbosch: Rustig gelegen halfmm*. vrijstaand woonhuis met cv- T_TT~B gas, garage, berging en tuin. Ind. I oa. provisiekelder. Woonkamer _*tai^_^ 't9\ *m met parketvloer, keuken met een _^^r~^tj>^. - J» ■___.___ complete keukeninstalltie met _^T __: P__flÉ apparatuur. Drie slaapkamers, *~_s__r ""^JSte """"y^Ë _fli m badkamer, zolder. Koopprijs -ft_|_F^ P y____ >#_| H*S^^l f 98.000- k.k. 'J_W lt^_ I ''Wm ■s^_—B_^_immmm -t_ ÜBACH OVER WORMS: Zeer i""*** W goed onderhouden tussenwo- HP__r i I -§• ■] ——l* ______ ning met o.a. provisiekelder, ver- __ Jm__ ___^a«_B__warmde hobbyruimte, royale fl li»**^^ .*"" __F 1 S_flHP*Bsr ■ L-vormige woonkamer, grote *""*» Bf » 1 I aparte keuken met moderne aan- Lm^fl It ,V- Pi__s. __^_H ■ bouwkeuken. bi|keuken. 1e __a^_lHn__j_M__N mmf"" 4__H___fl Iverd —^——~imrm HRÉ^E . .\_H_HEs»~' Mb^^^S»_i ~^s«_rï_B Dadkamer TraP naar beschoten HEERLEN: Vrijstaande semi-bungalow met c.v.-gas en mooie l__il ■__■__ ■en DePlank,e zolder. Het pand is tuin Ook geschikt als wonen met kantoor- eaot praktijkruimte: BH voorzlen van Pnma ISolalie' rond' gedeelteijk geïsoleerd, gedeeltelijk dubbele beglazing en rol- ■___ __fl om rollulken met een acn>eromluiken. Ind. oa.: royale hal, living (ca. 64 m 2) met leistenen _«—^—^^_i_____» ingang. De bmnenhot is geheel vloer, openhaardpartii en groot terras: keuken met inrichting: 6 bestraat, c.v.-gas. Huurgarage ter overname. Koopprijs kamers: 2 badkamers Prijs ƒ 385 000- k.k. | ƒ 105.000,-k.k. s^^^T^M-t^—T—sT S_J_UBH%fc A i\ garage met extra bergzolder, \^r_^T 't I __^__sJB_g_S_a i*^ I>, goed aangelegde tuin. Mu} n I _rnSsfn^!s&^* i yim^m^^^^^^ • ren en dak zn geisoleerdr _______^__, ■■__ _r ""*l 1 ' dubbele beglazing, rolluiken. mm | ■t—'^jf mm _\ _m I U____L| I' ■ B. '- I Uitstekend onderhouden. RL>jifl B_ ■*•——■■■■ |ncj oa: woonkamer, keu, F WmTf'fr™m W jm flLL__fl ken met een luxe keukenmstallatie met apparatuur, 3 slaapka_^.""~*-"" -^jsCL^J _s_-^.---■** -J* -jk~«(- ""jslV^ mers, badkamer, grote zolder-hobbyruimte (vaste trap). HEERLEN-SchimTnelpenninckstraat: 12 Premie-A-wonin- Vraagprijs ƒ 195.000- k.k gen Nog slechts enkele van de 12 premie-A-woningen te I ___ 1 koop Ruime haltvrijstaande woningen met gas-c v , berging (mogelijkheid uit te bouwen tot garage) en tuin. Ind o.a : L-vormige woonkamer, keuken, drie slaapkamers, badkamer en ■_■■ ■ ■■_ _■■■_ _1 e^aa^a£?fsi^dezewonin9envan | Wi nke I-bedr i|f spanden | EYGELSHOVEN (Veldhofstraat): Winkelpand met boyenwoning HEERLEN - De Erk: Vrij- Ind. oa : kelder, winkelruimte (totaal ca. 35 m 2), keuken, kamer. 1e {| ij- | staand woonhuis met cv- verd.: woonkamer, keuken, douche. 2e verd.: 2 mansardekamers -: gas, inpandige garage en Aanvaarding na 1-1-1990 Vraagprijs ƒ 79.000-k.k. _Fc i-s ~~* I ïYtmt Pfach'ige tuin met veel pri_• *4C___|i I Mmvm vacy (op t zuid-westen gele_ __fl l I 1 l fIU gen) Uitstekend onder- _________% HEERLEN-Heksenberg: Win- Ll IfcL ■ houd Ind oa. L-vormige __, .''-*•—mm. kei woonhuis voor diverse doel- I woonkamer, eetkeuken met f_W~k.' ""*•""'; *-:.- enden 9e^n'kr '^ oaoOJn'm3e derruimte Sout.: garage. prov?steS' 6Pnjs _M_____l___M I Ter'k6^,6""' Th 348000-kk aai- B~J~■■■!■ ■ douche. 2e verd.: slaapkamer, :—I I zolderruimte Aanvaarding: in _& HOENSBROEK: Aan voorzijde _j___^___ MPJBBSi overleg. Vraagprijs ƒ 179.000--________________ _ vrij gelegen woonhuis met cv - Bjl^^^_^^ k.k. ""■■■■■B BÜI^Mh gas en achtergelegen garage Pri- -ï- ~^—'"" ■•^~^~Jï? ma materiaalgebruik. Ind o a be- C_ 3 I tegelde gang, ruime woonkamer KERKRADE: Grenzend aan het centrum vrijstaand winkel-kan, i* met parketvloer, eetkeuken met toorpand (ca. 66 m 2) met boyenwoning; c.v.-gas, werkplaats/gara■__^~r_Plll_il L-vor""l'9e„ aanrechtcomb.natie, ge, pa,iotuin. Vraagprijs ƒ 135.000- k.k. ■■ [ m\\ dne slaapkamers, betegelde bad- a ""■ L_Xfe| ffi|flll kamer met douche en vaste was- crHjr-SBr-Bf- n pd ■--*^""'™, Kco'ppZr?sTl2l)aÓO0a-dk,k 9 n°,k j|flflflflflH__«to_ in hel w|nkelcentrum (Streeper- Hy ' ; ___p~fl B_H_ s,raa')' gelegen winkelpand met HOENSBROEK: Bouwterrein Heerlerweg ca. 750 m 2 per ka- i >^___Ï___Fl'M|__BM^ oprit' ruime ,vin en c v '9aS' rui' vel Koopprijs ƒ76 000,- k.k Grotere/kleinere oppervlakte is l _£JE*. !_ _T me kelders Winkelruimte ca 40 -nogglijl^ | m 2. woonkamer, keuken en op- f 'V_| ""l ""f""-_| slagruimten. 1e verd.: grote HOENSBROEK: Goed onderhouden tussenwoonhuis met cv- —fj_f| -'• ' f woonkamer, keuken, badkamer, gas, berging en zeer grote achtertuin Bouwjaar 1977 Ind o a bet i^__,l _■ __■■ slaapkamer, vaste trap naar zolhal woonkamer met tegelvloer, keuken, 3 ruime slaapkamers, bet. .__ ~nß__Tf __T m üe' mei twee mansardekamers, badkamer zolder. Een huis dat u van binnen moet zien! Prijs __~*_T i_Pf P■"" ■ Soede staat van onderhoud / 110 000 -k k I iJflflflH ■'""___, Aanvaarding in overleg. Prijs te""""'—' '—I f^ 'WB^m***'-- -Jta I gen elk aannemelijk bod. KERKRADE: Ruim hallvrij- __fc_s—_—s—si■■H—__■ staand woonhuis met cv- ÜBACH OVER WORMS: TE HUUR: Praktijk-kantoorruimte ca 80 _hm_^»^_^_^_^_^__ 935. garage met zolderruim- m 2. Goed gelegen Huurpnis ƒ 900- per maand (exclusief BTW) J «fit— I Geïsoleerd Bouwjaar 1981 Taxaties ». MM- _ __■_ _ geheel on- makelaardij 0.g.,' __. •_| __■ derkelderd Begane grond: hypotheek-adviescentrale ■ •*■ MT woonkamer met open haard. m»t compleet ingerichte keuken Maandaa tot en met vrijdag I __. 1e verd.: drie ruime slaapkamers, badkamer met o.a ligbad en va= g M (ot lg _JJ ■ douche 2e verd vaste trap. hobbyruimte (mogelijkheid 4e Ook 's zaterdags I slaapkamer) Vraagpnis ƒ 229 000- k k | geopend van I 9.00 tot 17.00 uur ijf^^^H KERKRADE: Geschakelde I __7_ I patiobungalow met c.v.-gas, Heerlenseweg 22, I §|g I tm inpandige garage en tuin. 6371 HS, Postbus 31193 I NVM ■ 4______fl _^_H_| _P md o a L-vormige woon- 6370 AD Landgraaf |--<■•-)__ ■ kamer (ca 38 m 2) met leis- # _ > ■______■__■__■_ fmpamLa ' leenvloer en open haard. D|_T___>_> LU.. r>-rt- _fl_| ke""ken. dne slaapkamers. TICIVCC HiaKelaaitllJ DV m^ktmW I 9060 uitgevoerde badka- ~~ * I mer Souterrain: garage- ■■■■■■^■■■—JPI-! •~*—^l»-^,,—^""—""^™ berging Ruime patiotum. j l'ÏÏS^S^r'J'i\fk iifA Prijs ƒ 169 000- k.k.",0
70,"O. TIEKSTRA T. TIEKSTRA-TEN HAVE Rein en Frouwina, Arjen Kievit 6 9861 HG Grootegast F VAN TIL M.VANTIL-RENKEMA Minke, Jan Middellaan 9 9861 CA Grootegast A. VAN DER VEEN H.A. VAN DER VEEN-HOPMA Anneke LangewegiS 9861 GA Grootegast K. VAN DER VEEN J.R. VAN DER VEEN-DE BOER Seppo en Anita, Arjanne Agentschap Ned. Dagblad Boven weg 13 9861GG Grootegast HENK en WILLEKE VAN DER VEEN-POOL Klaas, Erik, jeanet Wilgenstraat 7 9861 EC Grootegast LIEUWE en FROUWKJE VAN DER VEEN Arnold, Bart Leeuwerik 16 9861 HC Grootegast G. WAGENAAR H. WAGE NAARBERGKAMP Geertje, Oeds, Albert Leeuwerik 28 9861 HC Grootegast G. VAN DER WAL F. VAN DER WAL-WIERSMA Tamme en Anita, Cor Hazelaarstraat 9 9861 CS Grootegast Gj. VAN DER WAL G. VAN DER WAL-ALSERDA Grutto 1 9861 aw Grootegast SAKE VAN DER WAL Grutto 51 9861 aw Grootegast DIRK-JAN en ANNEKE, JESSICA en MARJOLEIN WESTERHOF-NEEF Hof laan 9 9861 BN Grootegast GIELCO en ANNEKE WESTERHOF-MULDER Henri, Thea, Bert, Sandra Kievit 27 9861 HE Grootegast S.H.WIERINGA G.WIERINGA-HUT Edgar, Willem Hoofdstraat 108 9861 AK Grootegast G. ZWART G. DE BOER Grutto 60 9861 av Grootegast JAKOB en KLAASKE ZWART-VAN DER VEEN Lucinda, Kor Langewegi2 9861 GD Grootegast SEBALDEBUREN PIETenINA VAN ASSEN-HOVING Prov.weg 70 9862 PG Sebaldeburen JELLE en PETRA DE BOER Richard, Jeroen, les A. DE BOER-LOPPERSUM Provinciale weg 2 9862 PE Sebaldeburen H. BOONSTRA M. BOONSTRA-BOOMSMA Provinciale weg 74 9862 PG Sebaldeburen H. BOONSTRA E. BOONSTRA-MERKUS Johnny en Annet, BartenClaudia, Dlta (R), Korien Prov.weg 53 9862 PB Sebaldeburen SJOERD en JANNIE BOONSTRA Anneke en Marieke irenestraat 5 9862 TR Sebaldeburen mark en WIES DE HAAN-SAATHOF Lucia, Jantiena, Reinder, weijanda westerzand 20 9862 tn Sebaldeburen R. DE HAAN J. DE HAAN-MOES Lucie, Cobie Westerzand 26 9862 TN Sebaldeburen J. HORENGA S. HORENGA-MARTINI Dirk SJoerd en Annet, Hendry, Evert Prov.weg 6 9862 PE Sebaldeburen ICO HOVING Provincialewegl23 9862 PD Sebaldeburen R. HOVING F. HOVING-BOONSTRA Lies Prov.weg 32 9862 PE Sebaldeburen JOH. KOOISTRA AJ. KOOISTRA-GREVELING Matthias en Fokje <D), Mirjam (U), Tabitha, Michaël, Nathan Prov.weg 79 Huize Cloeckstede 9862 PC Sebaldeburen K KRIJGSHELD I. KRIJGSHELD-GRASDIJK Prov.weg 21 9862 PA Sebaldeburen ROELenDINEKE MOSSELAAR Arjan, Erwin Prov.weg 99 9862 PO Sebaldeburen JELLE en THEA SIKKEMA-DE BOER Gerrit Jan Prov.weg 109 9862 PD Sebaldeburen",0
71,"NAALDWIJK 20 Dec. — Alicantcn 1.10—1.37, stoofperen 32. andijvie 30 savove kool 6 boerenkool 9—14. spruiten 48—56. witlof 40—50, prei 11 —13 uien 6. alles per kg. sla 2.60 per 100 krop, selderij 9.80—11.60 per 100 bos spinazie 43—49 per kg, tomaten 94— 1.23 per 12'2 kg. knolselderij 10—18 per stuk. champior.s 360 per kg schorseneren 13—37 per kg. NOORD-SCH ARWOUDE. 20 Dec. — Groente: 400 kg. aardappelen, grote 9; 4400 kg uien 3 80—4.80; grote 5.40—6: nep 11.40; 18500 kg. rode kool ü—12,30; 2500 kg. gele kool 5.50—7.40. 4800 kg. groene kool 7—10.80; 41000 kg. witte kool; succes 5—5.30; Deense witte kool 5—6. BROEK OP LANGENDIJK. 20 Dcc — Groente: 3 000 kg bieten (A) in.3o. bic'en (B) 6.40. 2.500 kg uien 3 90—5, grov» 5.80—6.50. 600 kg peer, (Cl 5 40. 12 00 kg groene kool 7—13 10 14.000 kg gele kool 5 50—6 90. 10 000 kg rode kool 6—lo 10. 30 000 kg witte kool, succes 5.60. Deense witte 5 10— 5.90 doorgedraaid 200 kg groene kool 2.500 kg gele kool. 1.500 kg rode kool. 1.000 kg wtttï kool.",0
72,"optie serie ■ omzet vk sk ond.w AEGN c okt 90 125 00 207 420 2.60 119.10 AEGN c okt 90 130 00 286 200 1.10 119.10 AEGN c okt 90 135 00 250 0.80 060 119.10 AEGN c jan 91 120 00 188 9.50 a 650 119.10 AKZO c okt 90 105.00 346 800 650 10830 AKZO c okt 90 110.00 707 470 330 108.30 AKZO c okt 90 115.00 311 2.50 190 108.30 AKZO p okt 90 105.00 225 160 2.40 108 30 AKZO p okt 90 110 PO 253 320 440 108.30 AKZO p okt 90 115 00 216 5.80 730 108 30 AKZO p okt 90 120.00 251 9.60 11.60 108 30 AKZO p jan 91 105 00 270 3.00 3.70 b 108.30 AKZO pokt 94 135.00 354 27 50 28 50 108 30 AMEV pokt 90 55 00 247 1.70 200 54.70 DSM c okt 90 105.00 330 280 250 102 60 DSM c okt 90 110 00 209 140 1.20 102.60 DSM pokt 90 100.00 521 2.30 3.90 102.60 ELSV pokt 90 90 00 280 1.50 290 90.50 GIST c okt 90 35.00 251 0 70b 050 30.10 KLM pokt 93 35 00 261 8.50 900 28 70 HOOG pokt 90 6000 357 2.20 2.80 a 62 60 HOOG p okt 90 6500 385 3.80 480 6260 HOOG p okt 90 70.00 402 660 750 62.60 HOOG p okt 90 80.00 191 15.70 17.30 62.60 KNP C Okt 90 45.00 204 3.00 2.40 45.20 KNP pokt 90 45.00 270 1.50 2.20 45.20 OLIE c okt 90 145.00 534 10.80 740 150.80 OLIE cokt 90 150.00 2296 6.70 4.30 150.80 OLIE cokt 90 160.00 1260 1.80 1.20 150.80 OLIE c jan 91 150 00 520 8.50 6.50 150.80 OLIE c jan 91 160.00 363 4.20 250 150 80 OLIE c apr 91 135.00 200 23.00 a 20.00 150.80 OLIE c okt 91 105.00 228 50 00 45 80 150.80 OLIE C okt 92 135.00 610 28 70 2580 150.80 OLIE pokt 90 135.00 210 0.40 080 150.80 OLIE pokt 90 140 00 720 0.70 1.50 150.80 OLIE pokt 90 145.00 724 1.70 3.00 150.80 OLIE pokt 90 150.00 1220 3.40 5.10 150 80 OLIE p jan 91 150.00 200 4,50 . 6.40 a 150 80 OLIE p jan 91 160.00 239 9.50 13 00 150.80 OLIE pokt 92 135.00 208 6.50 7.80 150.80 NATN c okt 90 70.00 356 2.60 1.50 67.00 NATN c okt 90 75.00 288 0.90 0.60 67,00 NATN c okt 90 80.00 278 0.30 0.20 67.00 NATN c jan 92 70.00 203 8.90 7.00 67.00 NATN c jan 93 70.00 271 11,60 10.00 67.00 NEDL c okt 90 70.00 240 5.00 5.00 71.50 NEDL c okt 90 75.00 259 2.50 2.80 71.50 NMB c jan 91 50.00 202 1.10 0.80 42.40 PHIL cokt 93 30.00 1171 6.10 5.60 26.00 PHIL c okt 94 45.00 277 3.00 2.80 26.00 PHIL pokt 90 25.00 253 0.90 1.20 26.00 PHIL p okt 90 27.50 595 2.00 2.50 26 00 PHIL p okt 90 3000 342 380 430 26.00 PHIL p jan 91 25 00 285 1.50 180 26.00 PHIL p apr 91 25.00 249 1.80 200 26.00 PHIL p okt 93 30.00 557 5.80 6.20 26.00 UNIL c okt 90 150 00 284 11.00 5.50 149.50 UNIL cokt 90 160.00 700 450 2.20 149.50 UNIL tokt 90 170.00 373 1.30 0.50 149.50 UNIL pokt 90 150.00 1543 2.00 4.30 b 149.50 UNIL pokt 90 160.00 501 5.30 10 50 149.50 VOC c jan 91 45.00 300 3.50 340 42.40 NLF c nov 90 100.00 1000 2.00 a 1.70 100.80 NLF c nov 90 102.50 1000 0 80a 060 100,80 NLF p aug 90 100.00 500 0.30 a 0.25 100.80 NLF p nov 90 100.00 750 0.70 0.70 100.80 DGX pokt 90 175 00 285 1.70 a 190 179 43 GOUD c aug 90 440.00 200 0 60a 0.30 379.20 EOE c aug 90 275.00 455 600 3.10 270.51 EOE c aug 90 280 00 866 3.80 1.40 270.51 EOE c aug 90 285.00 232 1.60 0.80 270.51 EOE c sep 90 280.00 560 5.00 3.50 270.51 EOE c sep 90 285.00 294 3.30 1.90 27051 EOE c sep 90 295.00 442 1.40 080 270.51 EOE p aug 90 275.00 1149 2.80 7.20 270.51 EOE p aug 90 280.00 1394 4.80 10 00 270.51 EOE p aug 90 285.00 632 8.00 14.00 270.51 EOE p aug 90 290.00 706 11.50 b 19.00 270.51 EOE p sep 90 275.00 941 6.00 10.50 270 51 EOE p sep 90 280.00 383 7.80 13.20 270 51 EOE pokt 90 250.00 391 2.20 3.50 270.51 EOE pokt 90 270.00 519 5.30 9.50 a 270.51 EOE p okt 90 275.00 323 7.50 11.50 270.51 EOE pokt 90 280.00 201 920 13.50 270.51 TOPS c aug 90 490.00 258 8.50 3.50 479.19 TOPS p aug 90 490.00 630 490 12 00 47919 MMIX c aug 90 615 00 300 0/07 008 569 08 MMIX c sep 90 580.00 650 17/08 17/10 569.08 Noteringen van vrijdag 3 augustus 1990 (tot 16:30 uur)",0
...,...,...
163,"GROENTEVEILING LEEUWARDEN, IS s„t Andijvie 11—13 et. per kg., Augurken 20-j»' et. per kg.. Bleten (Kroten) 6-10 et oer l^1 Idem (gekookt) 18-24 et per kg., Bloemkool 9—33 et. per stuk. Pronkbonen 12—41 rt ° ' kg., snijbonen 35-74 et. per kg stokboncrié —«5 et. per kg.. Dubbele witte bonen 22—n „> per kg., Kaskomkommers 7—15 et. öir_,,,_.- I platglaskomkommers 7-11 et. Per !}""*• Groene kool f 1.40-11.60 per 10 kg.. Rode kn«i 70—115 et. per 10 kg.. Savoye kool 60-115 per 10 kg., Witte kool 61-80 et. per ïov. Meloenen 15—39 et. per stuk, Ananas meloenf;1 40—50 et. per stuk, Peen 7—15 et. per k« bIT. pen * 1.30—* 1.60 per 10 bos, Peterselie ïó-i« et. per kg.. Prei 14—18 et. per kg„ seldTrM 7-10 et. per kg.. Knolselderij 43-^4B et n.r 10 stuks, Natuursla 23—95 et. per 10 kr„"" Spinazie 29—36 et. per kg.. Natuurtomaten li -32 et. per kg., Uien 9-13 et. per kg., S,ri ven 70—90 et. per kg.. Pruimen 32—70 et n» kg., Perziken 10—27 et. per stuk, stooisl»' in_ 13 et. per kg. ""^ GROENTEVEILING TE SNEEK, 18 gïpt Bloemkool 8-32 et. per stuk. Snijbonen M et. per kg.. Postelein 14—18 et. per kg.. AmT len 8-41 et. per kg.. Andijvie (£l4 ct* peVïï Gele kool B—l 2 et. per kg.. Rode kool 9-12 Jt' per kg., Witte kool 6-7 et. per kg.. Peterselie 20—46 et. per kg.. Pronkers 12—30 et. per k» Slabonen 22—48 et. per kg., Spinazie 14—Si -7 per kg.. Druiven 60—90 et. per kg., Tomaten 12-32 et. per kg.. Peren 6-35 et. per kT Meloenen 20—42 et. per st., Bospeen B—ls m' per bos, Sla 30-^0 et. per 10 krop, Was Deen B—ls et. per kg.. Komkommers B—l 2 et n.r stuk. ' v COOP. FRUIT- EN GROENTEVEILING TE HARLINGEN, 18 Sept Andijvie fs—fB per 100 kg.. Bloemkool A f25—f33 per 100 stuks, B f 15—f21 per ion stuks, C f 12—f 14 per 100 stuks, Waspeen f6--f9 per 100 kg.. Groene kool f9—f 13 per ion kg., Knolselderij f 2-t 5 per 100 stuks, Komkommers f 7—f 9 per 100 stuks, Kroten f5-f . per 100 kg., princessebonen (dubbej) f2S—f34 per 100 kg.. Stokprincessen f 46—f49 per im kg., Stoksnrjbonen f4O per 100 kg., sla f 3.10--f4 per 100 stuks, Rode kool <5—f 8 per 100 kg., savoye kool f 4—f 5 per 100 kg., uien f3--f 6 per 100 kg., Witte kool f 4—fs per 100 y. Tomaten f 12—f21 per 100 kg.. Druiven f 57--fBO per 100 kg., Meloenen f 26—f 38 per 100 t\. Appelen. Transp. de Cronsels: St«n4. f2l f 23. Huish. 1 fl7—f2o. Huish. II U3-U5, Fabriek f 10—113: Zoete Bloem*: Huish. i f 12. Huish. n f 10—f 11, Fabriek f B—l 9, alles per 100 kg. peren. Triumph de Vienne: Hulsh. 1 ta. Fabriek f3B. alles per 100 kg. WEEKMARKT HEERENVEEN, 18 Sept. De aanvoer op de markt bedroeg 15 vette varkens. De vraag overtrof verre het aanbod, zodat er een vlotte handel was met iets hoger prijzen. NAJAARSMARKT TE BERGUM, 18 Sept Op de gehouden najaarsmarkt werden «ingevoerd: 6 koeien, 231 paarden. 77 veulens, 17 geiten. 28 schapen, 46 lammeren, 18 biggen en 4 kalveren. GEM. VISAFSLAG TE STAVEREN Aan de gemeentelijke visafslag werd 18 Sept. aangevoerd: 2126'/t kg. snoekbaars, prijs 70—72 et. per kg.; 336 kg. kg. baars, prijs 50 et. per kg.; 927' i kg. blei, prijs 6 et. per kg.",0
164,"Waarom is Irak Kuwayt binnengevallen? Kuwayt is erg rijk. Het land heeft heel veel olie in de grond. Voor die olie heeft de hele wereld belangstelling. Als Kuwayt olie verkoopt krijgt het land dus veel geld binnen. Saddam Husayn heeft niet zoveel geld meer. Het land heeft acht jaar oorlog gevoerd met Iran en dat heeft heel veel gekost. Eerst maakte Saddam ruzie met Kuwayt over één olieveld, daarna was hij kwaad omdat de staat teveel olie zou verkopen. Als er veel olie wordt verkocht wordt de prijs lager en dan krijgt Irak ook minder geld voor zijn olie. Husayn dacht dus door Kuwayt te bezetten de baas te kunnen spelen in die staat en rijk te worden. Waarom bemoeit Amerika zich met een oorlog om olie tussen twee landen die zo ver weg liggen? Is olie zo belangrijk voor Amerika? Olie is inderdaad belangrijk. Niet alleen voor Amerika, maar voor de hele wereld. Van olie wordt onder meer bezine gemaakt en daar hebben we veel van nodig, alleen al om auto's te kunnen laten rijden. Verder worden van olie heel veel dingen gemaakt die bijna alle mensen gebruiken. Denk bijvoorbeeld maar eens aan verpakkingsmateriaal. Maar Amerika is zich er niet alleen maar mee gaan bemoeien omdat de wereld olie nodig heeft. De Verenigde Naties, een club van bijna alle landen in de wereld, hebben met elkaar afgesproken dat ze er voor zullen zorgen dat er geen oorlog meer komt in de wereld. Als er toch zomaar een land wordt bezet, dan zullen ze met elkaar dat land helpen. De Verenigde Naties zijn heel kwaad dat Husayn zomaar een ander land is binnen gevallen. Er is maandenlang gepraat met Saddam, sinds hij op 2 augustus Kuwayt bezette. Maar het hielp niks. Toen is gezegd: als je op 15 januari niet weg bent, moeten we maar geweld gebruiken. Dan vallen we je aan. Amerika is een van de grootste landen van de wereld en heeft een heel groot leger. Zo'n groot land heeft natuurlijk meer kans de oorlog te winnen dan een klein land. Daarom is Amerika begonnen, maar omdat eigenlijk de Verenigde Naties hebben beslist dat er geweld moet worden gebruikt, helpen andere landen Amerika mee. Wat heeft Israël er nou eigenlijk mee te maken? Heel veel Arabische landen hebben een hekel aan Israël. Ze vinden dat de joden in 1948 geen eigen staat hadden moeten krijgen, ze vinden ook dat Israël lelijk doet tegen de Palestijnen die geen eigen land hebben en ze vinden Israël te ""westers"". De Arabische landen vinden het ook verkeerd wat Saddam in Kuwayt heeft gedaan. Ze zijn niet zo dol op Amerika maar ze haten Israël nog meer. SaddamHusayn dacht: ik zeg dat ik heel kwaad ben op Israël omdat dat land zo onaardig doet tegen de Palestijnen. Zo kwaad dat ik ze met raketten ga bestoken. Dan doet Israël vast wel wat terug en dan worden de andere Arabische landen nog bozer op Israël. Misschien helpen ze mij dan en zijn ze geen vrienden meer met Amerika. Tot nu toe heeft Israël nog niks terug gedaan. En er zijn Arabische landen die nu hebben gezegd dat ze toch vrienden blijven met Amerika als Israël iets terug doet. Maar of dat ook zo is moeten we afwachten. Komt er straks oorlog in de hele wereld en ook in Nederland? Die kans is niet groot. Irak is niet zo'n groot land en Saddam",1
165,"Heb je die vogel op de televisie gezien? Een vogel, helemaal zwart van de olie, probeerde wanhopig over een muurtje te springen. Je zag hoe hij zijn vleugels probeerde uit te spreiden. Het lukte hem niet. De zware olie kleefde over heel zijn lijf. De vleugels bleven aan het lijfje vastzitten. De vogel zal nu wel niet meer leven. Saddam Husayn heeft zijn doel bereikt. Televisiebeelden van dat ene vogeltje schokten mensen over heel de wereld haast meer dan de beelden van bombardementen op Tel Aviv. Verbijsterd vragen de mensen zich af, hoe Saddam Husayn zo wreed kan zijn. Zomaar olie in de Perzische Golf laten stromen. Niemand kan dat tegenhouden. Er is meteen een nieuw woord uitgevonden: milieuterrorisme. Saddam Husayn noemen we sinds zaterdag een milieuterrorist. Hij maakt de leefomgeving van planten, dieren en mensen in het Golfgebied bijna onherstelbaar kapot. En waarom? Omdat hij boos is op de Verenigde Staten en zijn bondgenoten. Jullie moeten je niet met mijn zaken bemoeien, zegt Saddam Husayn grimmig. Kuwayt is de negentiende provincie van Irak en zal dat blijven, voegde hij eraan toe. Ik zal wel zorgen dat de schade behoorlijk is, stelt de Iraakse milieuterrorist. De olieramp is het nieuwste wapen van Saddam Husayn in de oorlog. De Amerikanen proberen dat machtsmiddel onschadelijk te maken. Ze doen dat door de pomp waaruit de olie komt, kapot te maken. Zo kan er geen nieuwe olie in het water komen. Meneer R. Schriel van het ministerie van verkeer en waterstaat zegt dat het voor Irak niet moeilijk was de geloosde olie bij de kust van Kuwayt in brand te steken. Je gooit een paar fosforbommetjes en de boel brandt, vertelt hij. Schriel vindt Saddam Husayn maar een domme man. Een Amerikaanse invasie vanuit zee op Kuwayt wordt juist makkelijker gemaakt door die olielozing. Olie damt de golven namelijk in. Het water wordt dan rustiger. De Amerikanen kunnen dan zo met hun bootjes naar de Kuwayts kust varen, vertelt de oliedeskundige. Meneer J. Kuiper, directeur van Ecomare op Texel, is ook ontzettend geschrokken van de televisiebeelden. „Die vogeltjes die ik op de tv zag, kunnen het nooit overleven. Als wij op Texel die vogeltjes in ons vogelopvangcentrum zouden krijgen, kunnen wij ze niet meer helpen. Verlos die diertjes maar uit hun lijden, zeg ik dan"". Ook de dolfijnen in het Golfgebied zijn door de olieramp ten dode opgeschreven, vertelt Kuiper. Zelfs al zou je met schepen in dat gebied kunnen komen om de beesten op te halen, dan nog kun je niets voor ze doen. Dolfijnen laten zich niet gemakkelijk pakken. En als zo uitgeput zijn, dat ze zich laten pakken, dan is het echt te laat. Kuiper noemt de olieramp in de Perzische Golf een 'gigantische ramp': Ik denk dat het minstens vijf jaar duurt voordat er weer leven mogelijk is in dat gedeelte van de zee. Het is gekkenwerk te denken dat die grote olievlek nog op te ruimen valt. De boten die zulke vlekken opruimen, hebben aan beide kanten 'armen' van tien meter. Dat is aardig om kleine vlekjes op te ruimen, maar zon grote vlek, daar is geen beginnen aan, stelt Kuiper. En zelfs al zou dat helpen, dan is dat nu geen oplossing. De opruimschepen kunnen en mogen niet in het oorlogsgebied komen.",1
166,"optie serie omzet vk Ik ond.w. AEGN c apr 90 115.00 111 2.70 a 2.30 109.90 AKZO c apr 90 130.00 62 440 4.30 127.30 ABN c apr 90 40.00 118 1.50 1.50 39.80 ABN c apr 90 42.50 66 0.50 0.60 , 39.80 ABN c jul 90 40.00 60 2.00 2.00 39.80 ABN c jan 92 40.00 96 4.50 4.40 39.80 ABN c jan 93 40.00 46 5.70 5.60 39.80 ABN p apr 90 40.00 100 100 I.oob 39.80 AMRO c apr 90 85.00 56 080 0.90 77.30 AMRO c jul 90 80.00 173 2 90b 2.90 77.30 DSM p apr 90 110.00 172 3.90 4.00 a 114.20 DSM p apr 90 120.00 78 10.50 11.00 114.20 DSM p apr 90 125.00 77 14.20 b 15.00 114.20 ELSV c apr 90 75.00 68 7.00 a 6.50 78.90 ELSV p apr 90 75.00 66 1.70 1.60 78.90 HEIN c apr 90 130.00 116 1.50 1.10 116.10 HEIN c apr 90 135.00 53 1.30 a 0.70 116.10 HEIN p apr 90 110.00 180 1.30 2.20 116.10 KLM c apr 90 45.00 133 2.10 1.90 43.10 KLM c jul 90 47.50 105 2.40 2.30 43.10 KLM p apr 90 45.00 100 3.20 3.30 43.10 HOOG c apr 90 70.00 58 7.00 6.90 a 73.10 HOOG c apr 90 80.00 79 2.30 2.00 73.10 HOOG c jul 90 80.00 109 3.40 3.10 73.10 HOOG p apr 90 80.00 124 7.80 7.50 73.10 HOOG p apr 90 85.00 82 12.00 12.00 73.10 HOOG p jul 90 80.00 74 11.80 12.00 73.10 KNP c apr 90 40.00 337 2.40 2.00 39.00 KNP c apr 90 42.50 50 1.30 1.40 39.00 KNP c apr 90 45.00 190 0.80 0.70 39.00 KNP c apr 90 50.00 329 0.50 0.30 39.00 KNP c apr 90 60.00 100 0.20 a 0.10 39.00 KNP c okt 90 45.00 50 2.00 1.80 39.00 KNP p apr 90 40.00 53 2.70 3.30 39.00 KNP p apr 90 55.00 50 17.00 a 16.80 39.00 KNP p jul 90 45.00 50 7.00 a 8.30 39.00 OLIE c apr 90 140.00 317 7.00 7.50 143.50 OLIE c apr 90 145.00 283 4.20 4.70 143.50 OLIE c apr 90 150.00 827 2.20 2.50 143.50 OLIE c jul 90 140.00 63 8.00 9.00 143.50 OLIE c jul 90 145.00 67 5.50 6.00 143.50 OLIE c jul 90 150.00 91 3.70 b 3.80 143.50 OLIE c jul 90 160.00 101 1.60 2.00 143.50 OLIE c okt 91 105.00 58 39.80 41.00 143.50 OLIE c okt 92,135.00 286 23.50 25.00 143.50 OLIE p apr 90 140.00 107 3.30 3.00 143.50 OLIE p apr 90 150.00 172 8.50 7.50 143.50 OLIE p jul 90 135.00 300 4.30 3.90 a 143.50 OLIE p okt 92 135.00 119 13.50 13.00 143.50 NATN c apr 90 75.00 58 1.70 1.70 70.80 NATN c jan 92 70.00 64 11.90 12.00 70.80 NATN c jan 93 70.00 129 15.00 14.80 70.80 NEDL c apr 90 90.00 102 2.50 3.50 86.20 NMB p apr 90 42.00 100 0.50 a 0.30 48.90 PHIL c apr 90 45.00 90 1.80 1.60 42.90 PHIL c apr 90 47.50 305 0.90 0.80 42.90 PHIL c apr 90 50.00 199 0.50 0.50 42.90 PHIL c jul 90 45.00 373 2.70 2.60 42.90 PHIL c jul 90 50.00 48 1.30 1.30 42.90 PHIL c jul 90 55.00 50 0.70 a 0.50 42.90 PHIL c okt 94 45.00 53 11.20 11.20 42.90 PHIL p apr 90 45.00 158 4.00 4.00 42.90 PHIL p apr 90 47.50 56 5.90 a 6.00 42.90 PHIL p jul 90 40.00 330 1.80 1.90 42.90 PHIL p jul 90 45.00 120 4.20 a 4.30 42.90 PHIL p okt 93 30.00 60 1.80 1.90 42.90 UNIL c apr 90 160.00 163 2.70 2.50 150.50 UNIL c okt 90 170.00 53 4.70 4.00 150.50 UNIL pokt 91 100.00 180 1.60 a 1.50 150.50 VOC c apr 90 35.00 50 3.40 a 2.90 35.30 VOC c apr 90 40.00 115 1.00 0.80 35.30 VOC c jul 90 35.00 113 4.50 4.00 35.30 VOC p jul 90 32.50 53 2.00 2.10 35.30 VOC p jul 90 35.00 61 3.20 3.50 35.30 DGX c mrt 90 190.00 75 3.00 3.20 b 189.69 GOUD c leb 90 400.00 103 20.00 19.50 a 415.85 GOUD c teb 90 410.00 200 13.00 10.00 a 415.85 GOUD c leb 90 420.00 123 6.60 6.50 415.85 GOUD c mei 90 410.00 59 26.00 a 25.00 415.85 GOUD c mei 90 420.00 60 21.00 21.00 415.85 GOUD c mei 90 430.00 50 15.00 14.00 415.85 EOE cfeb 90 280.00 456 5.70 5.00 280.50 EOE c teb 90 285.00 370 3.70 2.80 280.50 EOE c teb 90 290.00 296 2.00 1.50 280.50 EOE c feb 90 300.00 200 0.60 0.50 280.50 EOE c mrt 90 280.00 60 9.70 8.30 280.40 EOE c mrt 90 295.00 200 3.50 300 280.40 EOE c mrt 90 305.00 200 1.60 a 1.50 280.40 EOE p feb 90 270.00 289 1.60 1.70 280.40 EOE p feb 90 275.00 320 2.50 3.00 280.40 EOE p feb 90 280.00 521 4.00 4.50 280.40",0


### TFIDF - Class

In [34]:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import train_test_split
from sklearn.pipeline import Pipeline
from sklearn.svm import SVC
from sklearn.naive_bayes import GaussianNB
from sklearn.naive_bayes import MultinomialNB
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import precision_score, recall_score, f1_score, accuracy_score
import warnings
import pandas as pd


def Vectorize(vec, X_train, X_test):

    X_train_vec = vec.fit_transform(X_train)
    X_test_vec = vec.transform(X_test)

    print("Vectorization complete.\n")

    return X_train_vec, X_test_vec


# Use multiple classifiers and grid search for prediction
def ML_modeling(models, params, X_train, X_test, y_train, y_test):

    if not set(models.keys()).issubset(set(params.keys())):
        raise ValueError("Some estimators are missing parameters")

    for key in models.keys():

        model = models[key]
        param = params[key]
        gs = GridSearchCV(model, param, cv=10, error_score=0, refit=True)
        gs.fit(X_train, y_train)
        y_pred = gs.predict(X_test)

        # Print scores for the classifier
        print(key, ":", gs.best_params_)
        print(
            "Accuracy: %1.3f \tPrecision: %1.3f \tRecall: %1.3f \t\tF1: %1.3f\n"
            % (
                accuracy_score(y_test, y_pred),
                precision_score(y_test, y_pred, average="macro"),
                recall_score(y_test, y_pred, average="macro"),
                f1_score(y_test, y_pred, average="macro"),
            )
        )

    return


## Preparing to make a pipeline
models = {
    "Naive Bayes": MultinomialNB(),
    "Gradient Boosting": GradientBoostingClassifier(),
}

params = {
    "Naive Bayes": {"alpha": [0.5, 1], "fit_prior": [True, False]},
    "Gradient Boosting": {"learning_rate": [0.05, 0.01], "min_samples_split": [2, 5]},
}

In [35]:
# Train-test split and vectorize
X_train, X_test, y_train, y_test = train_test_split(
    train["text_wop"], train["sentiment"], test_size=0.3, shuffle=True
)

X_train_vec, X_test_vec = Vectorize(TfidfVectorizer(min_df=3, max_features=None,
                      strip_accents='unicode', analyzer='word',token_pattern=r'\w{1,}',
                      ngram_range=(1, 2), use_idf=1,smooth_idf=1,sublinear_tf=1), X_train, X_test)

ML_modeling(models, params, X_train_vec, X_test_vec, y_train, y_test)

Vectorization complete.

Naive Bayes : {'alpha': 1, 'fit_prior': True}
Accuracy: 0.905 	Precision: 0.889 	Recall: 0.929 		F1: 0.899

Gradient Boosting : {'learning_rate': 0.01, 'min_samples_split': 2}
Accuracy: 0.762 	Precision: 0.757 	Recall: 0.679 		F1: 0.692

