In [1]:
from ics import Calendar
import pandas as pd
import numpy as np
import utils as ut
import re

In [13]:
def preprocess(file_object, output_path):
    """
    Adjust the formatting of LOCATION lines so that the next two lines are indented
    and replace occurrences of "Ny Stadion" with Ny Stadion.
    """
    with open(file_object, 'r', encoding='utf-8') as f:
        lines = f.readlines()

    # Combine all lines into a single string for easier processing
    content = ''.join(lines)

    # Replace "Ny Stadion" with Ny Stadion
    content = content.replace('"Ny Stadion"', 'Ny Stadion')

    # Split the content back into lines
    lines = content.splitlines()

    processed_lines = []
    i = 0
    while i < len(lines):
        line = lines[i]
        processed_lines.append(line + "\n")  # Ensure lines retain newline characters

        # Check if this line is a LOCATION line
        if line.startswith("LOCATION:"):
            # Indent the next two lines if they exist
            if i + 1 < len(lines) and not lines[i + 1].startswith(" "):
                processed_lines.append(" " + lines[i + 1].strip() + "\n")
                i += 1
            if i + 1 < len(lines) and not lines[i + 1].startswith(" "):
                processed_lines.append(" " + lines[i + 1].strip() + "\n")
                i += 1
        i += 1

    # Write the processed lines back to the output file
    with open(output_path, 'w', encoding='utf-8') as f:
        f.writelines(processed_lines)


In [14]:
preprocess("../icals/kampe9b1978b9-7540-4643-a79a-b4225180718b.ics", "fixed/test2.ics")

In [15]:
ut.parse_ics_to_csv("fixed/test2.ics", "csvs/test2.csv")

In [19]:
df = ut.mk_df()

In [16]:
with open("csvs/test2.csv", 'r', encoding='utf-8') as f:
    raw_data = f.read()

    # Split the data into entries by matching content between double quotes
entries = re.findall(r'"(.*?)"', raw_data, re.DOTALL)

In [17]:
entries

['U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335020\n\nFrem - Nykøbing FC\n\nValby Idrætspark\nJulius Andersens Vej 1\n2450 København SV\n\n31-05-2025 kl. 10:00',
 'U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335021\n\nA27 - Greve Fodbold\n\nTårnby Stadion\nGemmas Alle 41\n2770 Kastrup\n\n01-06-2025 kl. 12:00',
 'U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335022\n\nNyk��bing FC - FC Helsingør\n\nNykøbing FC\nØstre Alle 123 B\n4800 Nykøbing F\n\n15-06-2025 kl. 12:00',
 'U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335023\n\nGVI - FA 2000\n\nGVI. Nymosen\nMosebuen 28 B\n2820 Gentofte\n\n15-06-2025 kl. 12:00',
 'U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335024\n\nStenløse BK - Vanløse\n\nStenløse Stadion\nDegnebakken 10\n3660 Stenløse\n\n15-06-2025 kl. 12:00',
 'U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335025\n\nGreve Fodbold - Frem\n\nGreve Idræts Center\nLillevangsvej 88\n2670 Greve\n\n15-06-2025 kl. 12:00',
 'U14 Drenge Liga Øst 2 forår (11) 2025\nKampnr 335010\n\nFre

In [20]:
df = ut.fill_df(df, "csvs/test2.csv")

In [21]:
df

Unnamed: 0,Årgang,Dag,Dato,Tidspunkt,Række,Kampnr,Hjem,Ude,Region,Scout
0,U14,Lørdag,31-05-2025,10:00,U14 Drenge Liga Øst 2 forår (11) 2025,335020,Frem,Nykøbing FC,Øst,
1,U14,Søndag,01-06-2025,12:00,U14 Drenge Liga Øst 2 forår (11) 2025,335021,A27,Greve Fodbold,Øst,
2,U14,Søndag,15-06-2025,12:00,U14 Drenge Liga Øst 2 forår (11) 2025,335022,Nyk��bing FC,FC Helsingør,Øst,
3,U14,Søndag,15-06-2025,12:00,U14 Drenge Liga Øst 2 forår (11) 2025,335023,GVI,FA 2000,Øst,
4,U14,Søndag,15-06-2025,12:00,U14 Drenge Liga Øst 2 forår (11) 2025,335024,Stenløse BK,Vanløse,Øst,
5,U14,Søndag,15-06-2025,12:00,U14 Drenge Liga Øst 2 forår (11) 2025,335025,Greve Fodbold,Frem,Øst,
6,U14,Lørdag,17-05-2025,10:00,U14 Drenge Liga Øst 2 forår (11) 2025,335010,Frem,Stenløse BK,Øst,
7,U14,Søndag,18-05-2025,13:00,U14 Drenge Liga Øst 2 forår (11) 2025,335011,Greve Fodbold,Vanløse,Øst,
8,U14,Lørdag,24-05-2025,11:30,U14 Drenge Liga Øst 2 forår (11) 2025,335012,Nyk��bing FC,Greve Fodbold,Øst,
9,U14,Søndag,25-05-2025,12:00,U14 Drenge Liga Øst 2 forår (11) 2025,335013,GVI,Frem,Øst,
