In [1]:
import sys
sys.path.append('..')
from nocola_to_df import get_df
from datasets import Dataset
from sentence_transformers.losses import CosineSimilarityLoss
from setfit import SetFitModel, SetFitTrainer
from models import SBERT_MODEL
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from constants import label_mapping

In [5]:
train_df = get_df(split="train")
dev_df = get_df(split="dev")
test_df = get_df(split="test")

train_df["label"] = train_df["label"].map(label_mapping)
test_df["label"] = test_df["label"].map(label_mapping)
dev_df["label"] = dev_df["label"].map(label_mapping)

def get_reduced_dataframe(df, min_samples=8):
    # proportion of each label, based on the minimum label
    proportion = df.label.value_counts() / min_samples
    # normalize it, so the lowest value is 1:
    proportion = proportion  / proportion.min()
    # multiply each by 8 (so that we ensure at least 8 samples)
    proportion = proportion * min_samples
    proportion = proportion.apply(round)
    proportion = proportion.to_dict()
    print(proportion)
    
    subset_dfs = []
    for label, desired_count in proportion.items():
        label_df = df[df['label'] == label]
        subset_dfs.append(label_df.sample(n=desired_count, random_state=42))
    subset = pd.concat(subset_dfs, axis=0).reset_index(drop=True)
    return subset

subset_train = get_reduced_dataframe(train_df, min_samples=8)
subset_eval = get_reduced_dataframe(dev_df, min_samples=3)
subset_test = get_reduced_dataframe(test_df, min_samples=3)

dataset = Dataset.from_pandas(subset_train)
dataset_test = Dataset.from_pandas(subset_test)
dataset_eval = Dataset.from_pandas(subset_eval)

{0.0: 90, 2.0: 74, 6.0: 73, 4.0: 62, 3.0: 59, 5.0: 49, 9.0: 28, 10.0: 10, 1.0: 8}
{0.0: 41, 2.0: 32, 6.0: 31, 3.0: 27, 4.0: 25, 5.0: 21, 9.0: 12, 10.0: 4, 1.0: 3}
{0.0: 41, 6.0: 34, 2.0: 31, 3.0: 29, 4.0: 27, 5.0: 19, 9.0: 13, 10.0: 5, 1.0: 3}


In [7]:
num_classes = len(dataset.unique("label"))

sfit_model = SetFitModel.from_pretrained(
    SBERT_MODEL,
    use_differentiable_head=True,
    head_params={"out_features": num_classes},
)
#Note: If you use the differentiable SetFitHead classifier head, it will automatically use BCEWithLogitsLoss for training.
# The prediction involves a sigmoid after which probabilities are rounded to 1 or 0.
# Furthermore, the "one-vs-rest" and "multi-output" multi-target strategies are equivalent for the differentiable SetFitHead.
# Create trainer
sfit_model.to("mps")
trainer = SetFitTrainer(
    model=sfit_model,
    train_dataset=dataset,
    eval_dataset=dataset_eval,
    loss_class=CosineSimilarityLoss,
    metric="accuracy",
    batch_size=16,
    num_iterations=20, # Number of text pairs to generate for contrastive learning
    num_epochs=1, # Number of epochs to use for contrastive learning
)
trainer.freeze()
trainer.train()
trainer.unfreeze(keep_body_frozen=True)
trainer.train(
    num_epochs=25,
    batch_size=16,
    body_learning_rate=1e-5,  # LR of body
    learning_rate=1e-2,  # LR of head
    l2_weight=0.0
)
metrics = trainer.evaluate()
print(metrics)

model_head.pkl not found on HuggingFace Hub, initialising classification head with random weights. You should TRAIN this model on a downstream task to use it for predictions and inference.


Generating Training Pairs:   0%|          | 0/20 [00:00<?, ?it/s]

***** Running training *****
  Num examples = 18120
  Num epochs = 1
  Total optimization steps = 1133
  Total train batch size = 16


Epoch:   0%|          | 0/1 [00:00<?, ?it/s]

Iteration:   0%|          | 0/1133 [00:00<?, ?it/s]

The `max_length` is `None`. Using the maximum acceptable length according to the current model body: 75.


Epoch:   0%|          | 0/25 [00:00<?, ?it/s]

***** Running evaluation *****


{'accuracy': 0.15816326530612246}


In [9]:
model = trainer.model
model

SetFitModel()

In [17]:
dataset_test[-10:]

{'text': ['De nye forbilder er nå blitt popstjerner, "Spidermann", "Pokemón" og så videre, og foreldrene, som er opptatt med seg selv, ikke er så viktige lenger.',
  'Hvis man liker å være isolert, det passer bedre å bo på fjellet eller i skogen, men hvis man trives med mennesker, er det mye bedre å bo i byen.',
  'det var min mening.',
  'Jeg Håper at jeg klarer denne testen, og kanskje Bergenstesten, for å ha bedre sjanse til å komme inn.',
  'Det er viktig at man finner på en aktivitet, for da får man mulighet til bli kjent med andre. Man kan alltid Lære noe positivt fra dem.',
  'Et annet spørsmål er organdonasjon fra dyr. her er det nok mange som igjen vil se det som forkastelig å "blande" dyr med mennesker.',
  'I mitt hjemland, Nederland, snakker de fleste engelsk, sånn at man ikke føler seg helt isolert i begynnelsen, men over lengre tid lønner det seg å snakke Nederlandsk for å komme seg med i det sosiale livet.',
  'For eksempel kan de bruke tiden på etterutdanning, kunst, mu

In [None]:
decoding = {v:k for k,v in label_mapping.items()}

In [27]:
subset_test.label.value_counts()

label
0.0     41
6.0     34
2.0     31
3.0     29
4.0     27
5.0     19
9.0     13
10.0     5
1.0      3
Name: count, dtype: int64

In [32]:
subset_test.label.value_counts()

label
0.0     41
6.0     34
2.0     31
3.0     29
4.0     27
5.0     19
9.0     13
10.0     5
1.0      3
Name: count, dtype: int64

In [33]:
subset_test.head()

Unnamed: 0,text,label
0,Han kan lage middag til familien og viser at m...,0.0
1,"Det aller viktigste for å ikke bli for tykk, e...",0.0
2,Mannen min og jeg kan kjøre bare noen minutter...,0.0
3,"Noen var lei av å være hjemme, og de var depri...",0.0
4,"Livet går videre, og vi må rett og slett gjøre...",0.0


In [50]:
from tqdm import tqdm
# iterate the test set, and get the predictions:
truths = []
preds = []
for text, label in tqdm(zip(subset_test.text, subset_test.label)):
    pred = model.predict(text).item()
    pred = float(pred)
    pred = decoding[pred]
    truth = decoding[label]
    print(text)
    print(f"Truth: {truth}, Pred: {pred}")
    print()
    truths.append(truth)
    preds.append(pred)

9it [00:00, 40.14it/s]

Han kan lage middag til familien og viser at matlaging ikke bare er for kvinner.
Truth: F, Pred: M

Det aller viktigste for å ikke bli for tykk, er vel en sunt kosthold, der frukt og grønnsaker spiller en stor rolle.
Truth: F, Pred: PUNC

Mannen min og jeg kan kjøre bare noen minutter og være ute i natur.
Truth: F, Pred: M

Noen var lei av å være hjemme, og de var deprimerte, fordi de ikke hadde sosiale kontakt med andre voksne.
Truth: F, Pred: M

Livet går videre, og vi må rett og slett gjøre noe for å bevare våre miljø som skal gitt videre til våre neste generasjoner.
Truth: F, Pred: W

Hos oss er det ganske ensomme av og til.
Truth: F, Pred: M

Det var ikke lett å bo i Norge frem til og med for 80 år siden, og det tror jeg er hovedgrunnen til hvorfor nordmenn er rolig og at de alltid vil hjelpe hvis du spør om hjelp.
Truth: F, Pred: M

Dårlige vaner hjemme kunne følge med en til et annet sted, men nye vaner burde man ta vare på, som for eksempel hvordan man gjør ting i dagliglivet o

14it [00:00, 38.31it/s]

Hvis du handle på Internett, var det veldig farlig, fordi andre kunne gå inn i dine betalingsmidler og bruke dine penger.
Truth: F, Pred: ORT

Det er veldig lett å gjøre det hvis de trenger litt. Etter hvert ble behov for varer større og større.
Truth: F, Pred: ORT

Flomen rammer disse landene hardt.
Truth: F, Pred: W

Jeg synes at hvis man ikke vil bli forstyrret, må man også sørge for at andre ikke bli forstyrret av en.
Truth: F, Pred: R

Hvordan er været i Kosovo om vinter og om sommeren?
Truth: F, Pred: R

Det finnes mange likheter og ulikheter mellom nærmiljø i Norge og i Ukraina.
Truth: F, Pred: PUNC

Barna får muligheter til å få den beste utdannelse og utviklingen fordi de kan studere ved private skoler.
Truth: F, Pred: R

Hun er den moderne forfatter og det er veldig interessant å lese bøkene hennes.
Truth: F, Pred: F

Jeg har lest en bok en gang.
Truth: F, Pred: W



24it [00:00, 42.20it/s]

Men for det meste får vi dårlige nyheter, om ulykke, om sult, om arbeidsledighet, om flyktninger, om krig osv.
Truth: F, Pred: M

Det er ofte veldig viktig å tar seg lang tid til å se etter hvordan de lokale menneskene oppfører seg, så vi kan bli kjent med deres sosiale koder.
Truth: F, Pred: W

Den beste vi kan gjøre er å være snille å sortere søppel og kaste det på riktig plass, og regjeringer kan i større grad fokusere på gjenvinning og resirkulering… Alt som jeg har skrevet om, er bare en liten del av forurensningen som har forårsaket klimaendringene.
Truth: F, Pred: F

Vold, kriger og mange dystre ting som påvirker barnas tankene.
Truth: F, Pred: PUNC

Her finnes det en stor verden av forskjellige produkter, tilgjengelig på et bitteliten skjerm.
Truth: F, Pred: ORT

Det beste vi kan gjøre er å være snille å sortere søppel og kaste dem på riktig plass, og regjeringer kan i større grad fokusere på gjenvinning og resirkulering… Alt som jeg har skrevet om, er bare en liten del av foru

34it [00:00, 43.96it/s]

Senere ble alle bøkene som han skrev veldig populært hos både barn og voksne.
Truth: F, Pred: ORT

Men samarbeid med EU er likevel utstrakt.
Truth: F, Pred: W

I november 2003 var det 42% som sa "ja" til norsk medlemskap, 36% utgjorde "nei-side", mens 22% av de spurte svarte "vet ikke".
Truth: F, Pred: W

Hvis en se at barna gjør noe galt, må en si det, ikke vente.
Truth: F, Pred: F

Det er viktig for barn også, fordi tradisjonene lærer dem om landet deres og familien sin.
Truth: F, Pred: M

Så, på grunn av nye tekniske muligheter, kan vi få vite, høre eller se "ferske" informasjon.
Truth: F, Pred: M

Flytting er noe som kjennetegner min fortid og mitt liv har blitt sterk påvirket av det.
Truth: F, Pred: ORT

Vi alle støtter kong Harald på vår egen måten.
Truth: F, Pred: F

De tenker på alle det gode et barn bringer til livet.
Truth: F, Pred: W

Forholdene i familier er vanligvis veldig varme.
Truth: F, Pred: PUNC



44it [00:01, 44.86it/s]

Det første jeg gjorde etter at jeg hadde sjekket inn på hotel, var å lete etter en god restaurant.
Truth: F, Pred: ORT

Det gjorde vond å forlate dem på grunn av vårt veldig lange og hyggelige vennskap.
Truth: F, Pred: M

Et annet problem når du har en mobil, er at folk blir sint når du ikke har den på hele tiden.
Truth: F, Pred: F

Mennesker liker å møte hverandre på mange ulike steder for eksempel på kafeer, i klubber, organisasjoner og lag.
Truth: PUNC, Pred: ORT

Barna mine har fått et normalt liv igjen, vi trives og jobber, går på skole og forstyrrer ingen og ingen forstyrrer oss.
Truth: PUNC, Pred: R

Det er mange argumenter som kan brukes i denne diskusjonen og alle har sin vekt.
Truth: PUNC, Pred: ORT

Jeg driver også med sport, så jeg er medlem på et treningssenter og der trener jeg mye, nesten hver dag. Der treffer jeg til og med mange kjente, og jeg synes at det er gøy å trene sammen med dem.
Truth: PUNC, Pred: PUNC

De forskerne som lager dette mønsteret, uttrykker at i gje

54it [00:01, 44.56it/s]

Som vi alle vet, har det skjedd en stor bevegelse i de siste åra når det gjelder lærernes høye lønnsøkning i forhold til andre yrkesgrupper.
Truth: PUNC, Pred: PUNC

Det er ikke så mange som fortsetter med alle disse spennende tradisjoner selv om Oslo er et svært katolsk land.
Truth: PUNC, Pred: W

Å jobbe på sykehjem er ikke lett, fordi på sykehjem bor eldre mennesker og det er ikke lett å snakke med dem når du lærer språket.
Truth: PUNC, Pred: M

Da må vi dra til kirken alle sammen og barna velsignes der.
Truth: PUNC, Pred: F

De sa at alt var under kontroll Uansett har kongen blitt sykemeldt.
Truth: PUNC, Pred: PUNC

Det gjelder ikke bare oss-utlendinger, men også norske barn.
Truth: PUNC, Pred: W

En kvinne måtte ikke tenke på seg selv og hun måtte være den perfekte husmor.
Truth: PUNC, Pred: F

I matvarebutikken er det mye større utvalg enn for 20 år siden og de frister folk til å kjøpe.
Truth: PUNC, Pred: M

Og det er kjempefint synes jeg.
Truth: PUNC, Pred: M

Om "det beste land

64it [00:01, 44.64it/s]

Kommunistene var kommet tilbake i regjeringen og jeg måtte rømme ut av landet fordi mitt liv var i fare.
Truth: PUNC, Pred: INFL

Dersom en kaster et raskt blikk på rike Norge så tar staten ansvar dersom vi ikke har arbeid.
Truth: PUNC, Pred: W

Vi pleide å skrive for å kommunisere bedre fordi vi hadde ikke så mange ord og uttrykk til å uttrykke oss med, og vi snakket ikke så klart, og uttalen var dårlig også.
Truth: PUNC, Pred: F

Gradvis ble mobiltelefoner mer og mer vanlige og i dag har mennesker i alle aldersgrupper mobiltelefon.
Truth: PUNC, Pred: PUNC

Og når du først får en venn så er det mye du må gjøre for å beholde han.
Truth: PUNC, Pred: F

Man tenker ikke hver dag over hvor viktig det er å ha venner, men når man er trist vet man hvor viktig vennskap er.
Truth: PUNC, Pred: PUNC

Vi vil bare ha mer og merDet er galt, ikke sant?
Truth: PUNC, Pred: F

Hva foregår på gata, og hvordan vi kan og må oppføre oss på gata og i bilen.
Truth: PUNC, Pred: ORT

Jeg synes det er kjedelig o

74it [00:01, 44.82it/s]

Når jeg treffer vennene mine, liker jeg å fortelle dem om det nye som har skjedd med meg, for eksempel på skolen, hjemme eller mange andre ting og faktisk liker de å prate om det som skjer med dem selv. Noen ganger liker jeg å møte dem hos meg, så kan vi spise, eller leie og se en god film.
Truth: PUNC, Pred: M

Vi har en båt, den er ikke så stor men vi er så glad for å ha den.
Truth: PUNC, Pred: M

Da hun var ferdig med skolen fikk hun en veldig bra jobb og tjente masse penger.
Truth: PUNC, Pred: PUNC

Jeg kunne ikke norsk og jeg husker at da jeg hørte det norske språket, forstod jeg ingenting.
Truth: PUNC, Pred: M

Verden forandrer seg raskt og hvis man ikke følger med på hendelser, blir man uvitende, og så å si isolert.
Truth: PUNC, Pred: R

Jeg liker å sy, strikke, lage mat og mine nye norske venninner kommer ofte på besøk for å prate om alt mulig.
Truth: PUNC, Pred: M

Og man kan gi dem mat, klær og et sted hvor de kan føle seg trygge og aksepterte. særlig hvis man jobber med barn

84it [00:01, 44.79it/s]

De opererte ham med en gang i sykehuset, og legen sa at han kunne ha vært død uten mobiltelefon.
Truth: W, Pred: F

Det finnes stadig flere unge som vil studere i stedet for å gjøre en utdanning eller gå i lære.
Truth: W, Pred: M

Tiden før brukte jeg til å lese for min 1. statseksamen i Oslo.
Truth: W, Pred: ORT

Imidlertid er en ikke integrert ennå.
Truth: W, Pred: W

Jeg startet å bli kjent med nordmenn lenge før jeg reiste hit.
Truth: W, Pred: M

Du kan besøke en kamp, som mange gjør, og føle spenningen, skuffelsen, og glede.
Truth: W, Pred: PUNC

Hvis en utlending snakker samme språket som folk i det landet han bor i nå, får de bedre muligheter og forutsetninger for å finne fram.
Truth: W, Pred: W

Hos oss er der ganske ensomt av og til.
Truth: W, Pred: M

I våre dager lever folk mye lengre enn det var mulig før.
Truth: W, Pred: M



94it [00:02, 43.76it/s]

Da jeg kom til Norge, var jeg helt overrasket av naturen her.
Truth: W, Pred: W

Vi bor i et lite sted, og det er vanskelig å finne jobb der, men vi kommer til å prøve alt for å finne jobb akkurat på det stedet.
Truth: W, Pred: ORT

Jeg bor i et område hvor jeg må ta lang tid på å komme til bussholdeplassen.
Truth: W, Pred: M

Når jeg ikke har fått brev på lang tid fra en god venn som normalt skriver snart tilbake, begynner jeg å sørge litt.
Truth: W, Pred: W

Alle tradisjoner som er viktige for de som bor i landet som du flytter til, skulle kunne bli lette nok å forstå hvis du bare undersøker dem litt i forveien.
Truth: W, Pred: PUNC

Uten å måtte skynde seg, eller å takle et raskt tempo i livet, uten å bli nervøs og stressende.
Truth: W, Pred: PUNC

Mennene er større fysisk enn kvinnene, og det er mange jobber som trenger det. Men i de meste jobbene trenger bedriftene også den "mykere" siden for å få gjort en oppgave.
Truth: W, Pred: ORT

Det sier jeg fordi jeg er fra Oslo, og det er

104it [00:02, 44.89it/s]

Jeg vet at nordmenn er svært stolt til å gå på fjelltur og ski.
Truth: W, Pred: W

Hunden hjelper både for humøret og for å komme seg ut.
Truth: W, Pred: M

Og vi har eksempel på dette i Balkan.
Truth: W, Pred: R

Noen av ulempene som énpersons-husholdninger har, er at folk kanskje er alene altfor mye.
Truth: W, Pred: M

Jeg liker å skrive litt om vennskap når det er flere hundre kilometer mellom venner.
Truth: W, Pred: R

Av og til må jeg vente ganske lenge på å få svar for brevene mine, og det er ikke alltid så lett.
Truth: W, Pred: W

Jeg vil gjøre det hele livet, mener jeg.
Truth: W, Pred: F

Da hun døde etter et langt liv, ble hun berømt som forfatter og beundret av samfunnet for sin hjelp om kvinnesaken.
Truth: W, Pred: W

Jeg og kjæresten min fant et forlatt hus for å bo i.
Truth: W, Pred: M

Dikteren fremhever at venner er sjeldne, somlysen de stuer langt bort i fjellmørket.
Truth: W, Pred: ORT



114it [00:02, 45.32it/s]

Trygde- og pensjonsordninger overtar rollen av barn som alderssikring.
Truth: W, Pred: W

Jeg kunne lese og studere på originalspråket romanene og diktene som berømte forfattere som Molière, Rousseau, Diderot, Hugo, Bolzac, Beaudelaire, Maupessant osv. hadde skrevet.
Truth: ORT, Pred: W

Det er en huggelig opplevelse for meg.
Truth: ORT, Pred: M

For oss som kommer fra land som har liknende kultur og er her i Norge, er det lit lettere enn for de som er svarte og har store kulturforskjeller.
Truth: ORT, Pred: PUNC

Det er alltid plass til en til, og det er ingen sam forventer at en nødvendigvis skal betale for seg.
Truth: ORT, Pred: F

Nesten ingen sier at penger er viktgere enn familie, men mange oppfører seg som om det er hva de virkelig mener.
Truth: ORT, Pred: F

Heretter skal vi ikke bestille billietter gjennom et norsk reisebyrå.
Truth: ORT, Pred: R

Alle dyr som var i kontakt med dette middelet, fikk store forandringer på kjønnsorganene, de ble misdannet, både i utsende og større

124it [00:02, 44.75it/s]

Der synger jeg sopran, noe som gleder meg veldig mye fordi jeg er kjempeglad i synging og i komponistene vi pleier å singe, for ikke å snakke om at jeg er flink å synge.
Truth: ORT, Pred: F

Et aspekt til, som jeg også synes at er viktig, er å vise interes for andre kulturer og mennesker.
Truth: ORT, Pred: M

På den tiden var det vanlig at mer enn en generasjon bodde sammen.
Truth: ORT, Pred: W

Skogsbrann og andre slags branner skader også miljøet.
Truth: ORT, Pred: PUNC

Alle vet at røyk er årssaken til kreft og dårlig helse.
Truth: ORT, Pred: ORT

Mann kan tenke på hva slags kaféer eller restauranter en plass har?
Truth: ORT, Pred: M

Jeg sitter bare med ett inntrykk av politikerne, de tenker kun på å redde statsbudsjettet og seg selv, og de nyetablerte for Gud ta seg av.
Truth: ORT, Pred: W

Vi har kjøpt et fint hus nå her i dette området, og en ting jeg liker veldig godt, er at barn kan leke på gaten, i skogen og på gresset utten å stå i hundedrit.
Truth: ORT, Pred: M

Det mannlig

134it [00:03, 45.32it/s]

Men hvis foreldrene er på jobb og barna er allene hjemme, ser de selvfølgelig på det.
Truth: ORT, Pred: M

Vi lager forsjellig mat, og vi spiser sammen. Noen ganger fisker vi, og noen ganger jakter vi.
Truth: ORT, Pred: R

I tillegg er det lettere å legge merke til de menneskene som har farlige religiose ideer, og stoppe dem.
Truth: ORT, Pred: ORT

Så mange ganger fant jeg ikke ord eller utrykk.
Truth: ORT, Pred: F

En annen ulemp er at folk blir eldre, og hvis de bor alene, har de ingen som kan passe på dem.
Truth: ORT, Pred: M

Men noen kan gjøre det når han er voksen dersom de ikke jorde det før.
Truth: ORT, Pred: PUNC

Jeg tror at årsaken er at mange mennesker er veldig optatt med yrket sitt, og liker å ha fritid og gjøre helt forskjellige ting enn i det normale yrkeslivet.
Truth: ORT, Pred: M

I butikkene fines mange nyere mobiltelefoner med kamera, MP3 og radio, men jeg vil ikke kjøpe den nyeste mobiltelefonen.
Truth: ORT, Pred: F

Alle professjonele sangere puster riktig og frit

144it [00:03, 46.18it/s]

Så kommer vi til del nummer to: fra den fjerde setningen til den sjekte setningen.
Truth: ORT, Pred: F

"Jeg har ikke glemt deg", i det øyeblikket kommer gleden.
Truth: M, Pred: M

Jeg tror at årsaken er at mange mennesker er veldig opptatt med yrket sitt, og liker å ha fritid og gjøre helt forskjellige ting enn i normale yrkeslivet.
Truth: M, Pred: M

Fotball er en av eldste idrettene som er tilgjengelig for alle mennesker.
Truth: M, Pred: PUNC

I Norge derimot, bor generasjonene lenge sammen.
Truth: M, Pred: W

Fabrikker – Her har mennesker muligheter til å få jobb i forskjellige fabrikker, og staten her i Norge har et stort budsjett og har mulighet for å hjelpe de menneskene som har en sykdom eller har vært en ulykke, som ikke har disse mulighetene der nede i Oslo.
Truth: M, Pred: W

Jeg er veldig glad i å jobbe på sykehjem, og nå har jeg planer å bli hjelpepleier.
Truth: M, Pred: M

Norge er ennå ikke medlem av EU, men betaler cirka 150 millioner kroner årlig likevel, bare de ikke 

154it [00:03, 46.68it/s]

I tillegg er det mye mindre kriminalitet enn i Oslo eller andre hovedstader i Europa.
Truth: M, Pred: R

Derfor det mer folk på Internett nå enn før.
Truth: M, Pred: R

Hadde jeg tilpasse meg hvis jeg bodde i f.eks. et afrikansk land?
Truth: M, Pred: W

Derimot det å ha gode naboer som man kan prate litt med og ta en øl av og til, hjelper for å ha et hyggelig bomiljø.
Truth: M, Pred: ORT

De drar til eller kommer fra et sted til annet sted.
Truth: M, Pred: W

Det finnes flere årsaker at man prioriterer netthandelen enn en vanlig handel på butikker og varehus.
Truth: M, Pred: R

Hvorfor ville hun ikke meg?
Truth: M, Pred: F

Men sunn mat er ikke det eneste betydning for høy livskvalitet og god helse.
Truth: M, Pred: PUNC

Egentlig var det bare tradisjonen som tvang alle kvinner sitte hjemme.
Truth: M, Pred: W

Min første følelse av norske naturen var min overraskelse.
Truth: M, Pred: F



164it [00:03, 45.60it/s]

Det letteste å svare på det, er at det er en person som jobber med mennesker.
Truth: M, Pred: F

Han liker å forsøke alt i naturen, og programmet hjelper ham, i tillegg til bøker.
Truth: M, Pred: PUNC

Jeg mener at når barna ser på programmene og filmene som er beregnet for voksne, kan de misforstå meningen og bruke det mot voksne og andre barn ved for eksempel bli frekke, uvennlige, voldsomme, aggressive.
Truth: M, Pred: F

Den reflekterte himmelen er brukt å gi en følelse av frihet og åpent landskap.
Truth: M, Pred: R

Hver nasjon trenger å ha en slags åndelig leder som kan samle rundt seg.
Truth: M, Pred: W

Mange har en jobb at de trenger å sitte hele arbeidsdagen.
Truth: M, Pred: F

Uten nyheter kan vi ikke vite om mange tingene som skjer i denne verden.
Truth: M, Pred: W

Det høres litt rart ut, men det er sant. Da jeg bodde i mitt hjemland, leste jeg veldig mye om Norge, om norske tradisjoner, historie, om geografi.
Truth: M, Pred: PUNC

I diktet prøver Lise så godt hun kan, men

174it [00:03, 46.06it/s]

Derfor For å gjøre et sted trivelig å bo på, må dette stedet ha noe som passer til alle aldres smak.
Truth: R, Pred: R

Helseprodukter som av kosttilskudd, treningsutstyr, treningstid, litteratur om livsstil, ernæring osv. er blitt markante innslag i vår vestlige hverdag.
Truth: R, Pred: PUNC

Nesten alle bedrifter har hjemmesider hvor du man kan kjøpe eller bestille varer.
Truth: R, Pred: W

Det er lettere å bo på et sted som har en flyplass så man ikke trenger å kjøre for lenge for å reise ut av Norge.
Truth: R, Pred: F

Hvis du vil bli akseptert, tror jeg at det går fortere hvis du lærer den språket fra landet. Du må også lære om folket, religionen og fester.
Truth: R, Pred: M

Men hvis man ser på hovedmålene til EU med bekjempelse av fattidom fattigdom og å unngå konflikter i framtida, viser det seg at Norge og EU baserer seg på felles verdier og prinsipper.
Truth: R, Pred: PUNC

Det er viktig Det er viktig å fortelle barnet sannheten.
Truth: R, Pred: F

Så, hva som gjør sted trive

184it [00:04, 45.40it/s]

Men jeg synes at det viktigste er det samarbeidet mellom foreldre og skole.
Truth: R, Pred: PUNC

Tid og energi som ellers kunne ha blitt brukt på en mer konstruktiv måte til å bygge opp et godt forhold til barna, er brukt dårlig utnyttet.
Truth: R, Pred: W

Vi kan få ringe etter hjelp og så videre.
Truth: R, Pred: M

Spesielt i de samfunnene hvor kvinner har langt fra de samme mulighetene til utdanning, ser vi ganske stor forskjell mellom de yrkene menn er inn i og de yrkene kvinner er i.
Truth: R, Pred: M

Man kan også se r på det på en annen måte.
Truth: R, Pred: F

Alltid ringer det mobiltelefoner når man sitter på kino, teater eller konsert er, som er steder hvor jeg synes at det ikke er akseptabelt at man ikke slår av mobiltelefonen.
Truth: R, Pred: F

Jeg håper at jeg skal fortsette en dag å studere dette yrket i Norge, og endelig få r jobben som jeg liker best.
Truth: R, Pred: M

Jeg har vært glad i ro, men nå Jeg har ikke mulighet til å ha noen.
Truth: O, Pred: F

Eller hvorda

194it [00:04, 46.29it/s]

Det er viktig for meg at hver uke vi gjør noen gøy sammen, sånn at hun har gode minner fra sin barndom.
Truth: O, Pred: ORT

Andre ungdommer er interessert i sport, så medler de seg inn i idrettsklubbene.
Truth: O, Pred: M

Denne diskusjonen har ført til en polarisering, hvor på en side står motstandere, og de som støtter innføring av private skoler på den andre siden.
Truth: O, Pred: W

Hvis alle mennesker er tolerante overfor andre, alle sammen har det bra.
Truth: O, Pred: PUNC

Det er mye som vi kan gjøre for unge når er de organisert.
Truth: O, Pred: W

Spesielt i Norge, ble jeg fortalt, er det ikke mulig å finne nok kvalifiserte kandidater på alle høgskoler, selv om norske ungdommer er stadig sterkere interessert i høyere teoretisk utdanning.
Truth: O, Pred: M

Hva foregår på gata og hvordan kan og må vi oppføre oss på gata og i bilen.
Truth: O, Pred: F

Det største er at de får sjansen å få et barn, noe de har kanskje drømt om.
Truth: O, Pred: F

De nye forbilder er nå blitt pops

202it [00:04, 44.78it/s]

det var min mening.
Truth: CAP, Pred: PUNC

Jeg Håper at jeg klarer denne testen, og kanskje Bergenstesten, for å ha bedre sjanse til å komme inn.
Truth: CAP, Pred: R

Det er viktig at man finner på en aktivitet, for da får man mulighet til bli kjent med andre. Man kan alltid Lære noe positivt fra dem.
Truth: CAP, Pred: R

Et annet spørsmål er organdonasjon fra dyr. her er det nok mange som igjen vil se det som forkastelig å "blande" dyr med mennesker.
Truth: CAP, Pred: F

I mitt hjemland, Nederland, snakker de fleste engelsk, sånn at man ikke føler seg helt isolert i begynnelsen, men over lengre tid lønner det seg å snakke Nederlandsk for å komme seg med i det sosiale livet.
Truth: CAP, Pred: F

For eksempel kan de bruke tiden på etterutdanning, kunst, musikk osv. Når du er alene, kan folk slappe av og glemme stresset fra jobbet.
Truth: INFL, Pred: M

Det er én ting som vi kan unngå, forurensning av vannen.
Truth: INFL, Pred: R

Nå er det blitt vanskeligere for oss å akseptere at vi e




In [49]:
accuracy = sum([1 for t,p in zip(truths, preds) if t == p]) / len(truths)


0.18811881188118812


In [28]:
# do some predictions
model([dataset_test[0]["text"]])

tensor([4], device='mps:0')

In [None]:
trainer.push_to_hub("tollefj/setfit-nocola-errortype-mps")