In [None]:
import pandas as pd
import numpy as np

# Krassen

In [None]:
# Inlezen CSV
df = pd.read_csv("resultaten_krassen.csv")
df = df.iloc[1:].reset_index(drop=True)
print(df)
# Ground truths instellen
ground_truths = ["581215", "581347", "581605", "581819"]
herhaalde_truths = pd.Series(ground_truths).repeat(5).reset_index(drop=True)
df["ground_truth"] = herhaalde_truths[:len(df)]

# String-normalisatie
for kolom in ["ground_truth", "zonder_reconstructie", "met_reconstructie"]:
    df[kolom] = df[kolom].astype(str).str.strip()

# Volledige matches
df["match_zonder"] = df["zonder_reconstructie"] == df["ground_truth"]
df["match_met"] = df["met_reconstructie"] == df["ground_truth"]

# Per cijfer accuratesse
def totale_cijfer_accuracy(grond, voorspelling):
    totaal_cijfers = 0
    correcte_cijfers = 0
    
    for gt, pred in zip(grond, voorspelling):
        gt = str(gt).strip()
        pred = str(pred).strip()
        lengte = min(len(gt), len(pred))
        totaal_cijfers += lengte
        correcte_cijfers += sum(g == p for g, p in zip(gt, pred))
    
    if totaal_cijfers == 0:
        return 0.0
    return correcte_cijfers / totaal_cijfers


# Totale scores
totaal = len(df)
aantal_goed_zonder = df["match_zonder"].sum()
aantal_goed_met = df["match_met"].sum()
cijfer_acc_zonder = totale_cijfer_accuracy(df["ground_truth"], df["zonder_reconstructie"])
cijfer_acc_met = totale_cijfer_accuracy(df["ground_truth"], df["met_reconstructie"])

# Reconstructie-effecten
hersteld_mask = (~df["match_zonder"]) & (df["match_met"])
verpest_mask = (df["match_zonder"]) & (~df["match_met"])

hersteld = df[hersteld_mask]
verpest = df[verpest_mask]



In [None]:
# === Resultaten tonen ===
print("ZONDER reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_zonder}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_zonder / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_zonder:.2%}")

print("\nMET reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_met}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_met / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_met:.2%}")

print("\nHersteld door reconstructie (was fout, is nu goed):")
print(hersteld[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

print("\nVerpest door reconstructie (was goed, is nu fout):")
print(verpest[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

# Overbelicht

In [None]:
# Inlezen CSV
df = pd.read_csv("resultaten_overbelicht.csv")
df = df.iloc[1:].reset_index(drop=True)
# Ground truths instellen
ground_truths = ["579079", "579079", "579079", "579079", "579079",
                 "579125", "579125", "579125", "579125", "579125",
                 "579125", "579125", "579125", "579125", "579125",
                 "579203", "579203", "579203", "579203", "579203"]
# herhaalde_truths = pd.Series(ground_truths).repeat(5).reset_index(drop=True)
# df["ground_truth"] = herhaalde_truths[:len(df)]
df["ground_truth"] = ground_truths[:len(df)]
print(df)
# String-normalisatie
for kolom in ["ground_truth", "zonder_reconstructie", "met_reconstructie"]:
    df[kolom] = df[kolom].astype(str).str.strip()

# Volledige matches
df["match_zonder"] = df["zonder_reconstructie"] == df["ground_truth"]
df["match_met"] = df["met_reconstructie"] == df["ground_truth"]

# Per cijfer accuratesse
def totale_cijfer_accuracy(grond, voorspelling):
    totaal_cijfers = 0
    correcte_cijfers = 0
    
    for gt, pred in zip(grond, voorspelling):
        gt = str(gt).strip()
        pred = str(pred).strip()
        lengte = min(len(gt), len(pred))
        totaal_cijfers += lengte
        correcte_cijfers += sum(g == p for g, p in zip(gt, pred))
    
    if totaal_cijfers == 0:
        return 0.0
    return correcte_cijfers / totaal_cijfers


# Totale scores
totaal = len(df)
aantal_goed_zonder = df["match_zonder"].sum()
aantal_goed_met = df["match_met"].sum()
cijfer_acc_zonder = totale_cijfer_accuracy(df["ground_truth"], df["zonder_reconstructie"])
cijfer_acc_met = totale_cijfer_accuracy(df["ground_truth"], df["met_reconstructie"])

# Reconstructie-effecten
hersteld_mask = (~df["match_zonder"]) & (df["match_met"])
verpest_mask = (df["match_zonder"]) & (~df["match_met"])

hersteld = df[hersteld_mask]
verpest = df[verpest_mask]



In [None]:
# === Resultaten tonen ===
print("ZONDER reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_zonder}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_zonder / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_zonder:.2%}")

print("\nMET reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_met}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_met / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_met:.2%}")

print("\nHersteld door reconstructie (was fout, is nu goed):")
print(hersteld[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

print("\nVerpest door reconstructie (was goed, is nu fout):")
print(verpest[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

# Rotatie

In [None]:
# Inlezen CSV
df = pd.read_csv("resultaten_rotatie.csv")
df = df.iloc[1:].reset_index(drop=True)
# Ground truths instellen
ground_truths = ["581898", "581898", "581898", "581898", "581898",
                 "582036", "582036", "582036", "582036", "582036",
                 "582140", "582140", "582140", "582140", "582140",
                 "582235", "582235", "582235", "582235", "582235"]
# herhaalde_truths = pd.Series(ground_truths).repeat(5).reset_index(drop=True)
# df["ground_truth"] = herhaalde_truths[:len(df)]
df["ground_truth"] = ground_truths[:len(df)]
print(df)
# String-normalisatie
for kolom in ["ground_truth", "zonder_reconstructie", "met_reconstructie"]:
    df[kolom] = df[kolom].astype(str).str.strip()

# Volledige matches
df["match_zonder"] = df["zonder_reconstructie"] == df["ground_truth"]
df["match_met"] = df["met_reconstructie"] == df["ground_truth"]

# Per cijfer accuratesse
def totale_cijfer_accuracy(grond, voorspelling):
    totaal_cijfers = 0
    correcte_cijfers = 0
    
    for gt, pred in zip(grond, voorspelling):
        gt = str(gt).strip()
        pred = str(pred).strip()
        lengte = min(len(gt), len(pred))
        totaal_cijfers += lengte
        correcte_cijfers += sum(g == p for g, p in zip(gt, pred))
    
    if totaal_cijfers == 0:
        return 0.0
    return correcte_cijfers / totaal_cijfers


# Totale scores
totaal = len(df)
aantal_goed_zonder = df["match_zonder"].sum()
aantal_goed_met = df["match_met"].sum()
cijfer_acc_zonder = totale_cijfer_accuracy(df["ground_truth"], df["zonder_reconstructie"])
cijfer_acc_met = totale_cijfer_accuracy(df["ground_truth"], df["met_reconstructie"])

# Reconstructie-effecten
hersteld_mask = (~df["match_zonder"]) & (df["match_met"])
verpest_mask = (df["match_zonder"]) & (~df["match_met"])

hersteld = df[hersteld_mask]
verpest = df[verpest_mask]



In [None]:
# === Resultaten tonen ===
print("ZONDER reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_zonder}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_zonder / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_zonder:.2%}")

print("\nMET reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_met}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_met / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_met:.2%}")

print("\nHersteld door reconstructie (was fout, is nu goed):")
print(hersteld[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

print("\nVerpest door reconstructie (was goed, is nu fout):")
print(verpest[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

# Schaduw

In [None]:
# Inlezen CSV
df = pd.read_csv("resultaten_schaduw.csv")
df = df.iloc[1:].reset_index(drop=True)
# Ground truths instellen
ground_truths = ["578542", "578542", "578542", "578542", "578542",
                 "578648", "578648", "578648", "578648", "578648",
                 "578818", "578818", "578818", "578818", "578818",
                 "579056", "579056", "579056", "579056", "579056"]
# herhaalde_truths = pd.Series(ground_truths).repeat(5).reset_index(drop=True)
# df["ground_truth"] = herhaalde_truths[:len(df)]
df["ground_truth"] = ground_truths[:len(df)]
print(df)
# String-normalisatie
for kolom in ["ground_truth", "zonder_reconstructie", "met_reconstructie"]:
    df[kolom] = df[kolom].astype(str).str.strip()

# Volledige matches
df["match_zonder"] = df["zonder_reconstructie"] == df["ground_truth"]
df["match_met"] = df["met_reconstructie"] == df["ground_truth"]

# Per cijfer accuratesse
def totale_cijfer_accuracy(grond, voorspelling):
    totaal_cijfers = 0
    correcte_cijfers = 0
    
    for gt, pred in zip(grond, voorspelling):
        gt = str(gt).strip()
        pred = str(pred).strip()
        lengte = min(len(gt), len(pred))
        totaal_cijfers += lengte
        correcte_cijfers += sum(g == p for g, p in zip(gt, pred))
    
    if totaal_cijfers == 0:
        return 0.0
    return correcte_cijfers / totaal_cijfers


# Totale scores
totaal = len(df)
aantal_goed_zonder = df["match_zonder"].sum()
aantal_goed_met = df["match_met"].sum()
cijfer_acc_zonder = totale_cijfer_accuracy(df["ground_truth"], df["zonder_reconstructie"])
cijfer_acc_met = totale_cijfer_accuracy(df["ground_truth"], df["met_reconstructie"])

# Reconstructie-effecten
hersteld_mask = (~df["match_zonder"]) & (df["match_met"])
verpest_mask = (df["match_zonder"]) & (~df["match_met"])

hersteld = df[hersteld_mask]
verpest = df[verpest_mask]



In [None]:
# === Resultaten tonen ===
print("ZONDER reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_zonder}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_zonder / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_zonder:.2%}")

print("\nMET reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_met}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_met / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_met:.2%}")

print("\nHersteld door reconstructie (was fout, is nu goed):")
print(hersteld[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

print("\nVerpest door reconstructie (was goed, is nu fout):")
print(verpest[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

# Stift

In [None]:
# Inlezen CSV
df = pd.read_csv("resultaten_stift.csv")
df = df.iloc[1:].reset_index(drop=True)
# Ground truths instellen
ground_truths = ["579296", "579296", "579296", "579296", "579296",
                 "579358", "579358", "580041", "580041", "580041",
                 "580105", "580105", "580105", "580105", "580105",
                 "580105", "580105", "580105", "580105", "580105"]
# herhaalde_truths = pd.Series(ground_truths).repeat(5).reset_index(drop=True)
# df["ground_truth"] = herhaalde_truths[:len(df)]
df["ground_truth"] = ground_truths[:len(df)]
print(df)
# String-normalisatie
for kolom in ["ground_truth", "zonder_reconstructie", "met_reconstructie"]:
    df[kolom] = df[kolom].astype(str).str.strip()

# Volledige matches
df["match_zonder"] = df["zonder_reconstructie"] == df["ground_truth"]
df["match_met"] = df["met_reconstructie"] == df["ground_truth"]

# Per cijfer accuratesse
def totale_cijfer_accuracy(grond, voorspelling):
    totaal_cijfers = 0
    correcte_cijfers = 0
    
    for gt, pred in zip(grond, voorspelling):
        gt = str(gt).strip()
        pred = str(pred).strip()
        lengte = min(len(gt), len(pred))
        totaal_cijfers += lengte
        correcte_cijfers += sum(g == p for g, p in zip(gt, pred))
    
    if totaal_cijfers == 0:
        return 0.0
    return correcte_cijfers / totaal_cijfers


# Totale scores
totaal = len(df)
aantal_goed_zonder = df["match_zonder"].sum()
aantal_goed_met = df["match_met"].sum()
cijfer_acc_zonder = totale_cijfer_accuracy(df["ground_truth"], df["zonder_reconstructie"])
cijfer_acc_met = totale_cijfer_accuracy(df["ground_truth"], df["met_reconstructie"])

# Reconstructie-effecten
hersteld_mask = (~df["match_zonder"]) & (df["match_met"])
verpest_mask = (df["match_zonder"]) & (~df["match_met"])

hersteld = df[hersteld_mask]
verpest = df[verpest_mask]



In [None]:
# === Resultaten tonen ===
print("ZONDER reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_zonder}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_zonder / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_zonder:.2%}")

print("\nMET reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_met}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_met / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_met:.2%}")

print("\nHersteld door reconstructie (was fout, is nu goed):")
print(hersteld[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

print("\nVerpest door reconstructie (was goed, is nu fout):")
print(verpest[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

# Wazig

In [None]:
# Inlezen CSV
df = pd.read_csv("resultaten_wazig.csv")
df = df.iloc[1:].reset_index(drop=True)
# Ground truths instellen
ground_truths = ["580249", "580249", "580249", "580249", "580249",
                 "580503", "580503", "580503", "580503", "580503",
                 "580814", "580814", "580814", "580814", "580814",
                 "581029", "581029", "581029", "581029", "581029"]
# herhaalde_truths = pd.Series(ground_truths).repeat(5).reset_index(drop=True)
# df["ground_truth"] = herhaalde_truths[:len(df)]
df["ground_truth"] = ground_truths[:len(df)]
print(df)
# String-normalisatie
for kolom in ["ground_truth", "zonder_reconstructie", "met_reconstructie"]:
    df[kolom] = df[kolom].astype(str).str.strip()

# Volledige matches
df["match_zonder"] = df["zonder_reconstructie"] == df["ground_truth"]
df["match_met"] = df["met_reconstructie"] == df["ground_truth"]

# Per cijfer accuratesse
def totale_cijfer_accuracy(grond, voorspelling):
    totaal_cijfers = 0
    correcte_cijfers = 0
    
    for gt, pred in zip(grond, voorspelling):
        gt = str(gt).strip()
        pred = str(pred).strip()
        lengte = min(len(gt), len(pred))
        totaal_cijfers += lengte
        correcte_cijfers += sum(g == p for g, p in zip(gt, pred))
    
    if totaal_cijfers == 0:
        return 0.0
    return correcte_cijfers / totaal_cijfers


# Totale scores
totaal = len(df)
aantal_goed_zonder = df["match_zonder"].sum()
aantal_goed_met = df["match_met"].sum()
cijfer_acc_zonder = totale_cijfer_accuracy(df["ground_truth"], df["zonder_reconstructie"])
cijfer_acc_met = totale_cijfer_accuracy(df["ground_truth"], df["met_reconstructie"])

# Reconstructie-effecten
hersteld_mask = (~df["match_zonder"]) & (df["match_met"])
verpest_mask = (df["match_zonder"]) & (~df["match_met"])

hersteld = df[hersteld_mask]
verpest = df[verpest_mask]



In [None]:
# === Resultaten tonen ===
print("ZONDER reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_zonder}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_zonder / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_zonder:.2%}")

print("\nMET reconstructie:")
print(f"  Aantal goed (volledige match): {aantal_goed_met}/{totaal}")
print(f"  Accuracy volledige reeks: {aantal_goed_met / totaal:.2%}")
print(f"  Totale cijfer-accuracy: {cijfer_acc_met:.2%}")

print("\nHersteld door reconstructie (was fout, is nu goed):")
print(hersteld[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])

print("\nVerpest door reconstructie (was goed, is nu fout):")
print(verpest[["zonder_reconstructie", "met_reconstructie", "ground_truth"]])