In [1]:
import csv

In [2]:
def compare_csv_files(file1, file2):
    """
    Compare two CSV files and return a list of differences between them.
    
    Parameters:
    file1 (str): Path to the first CSV file
    file2 (str): path to the second CSV file
    
    Returns:
    list: A list of dictionaries, where each dictionary represents a row that is different between the two CSV files.
    """
    
    #read the content of both files
    with open(file1, 'r') as f1, open(file2, 'r') as f2:
        reader1 = csv.reader(f1)
        reader2 = csv.reader(f2)
        file1_rows = [row for row in reader1]
        file2_rows = [row for row in reader2]
        
    #compare the rows in both files
    differences = []
    for i in range(len(file1_rows)):
        if i >= len(file2_rows):
            differences.append({'row': i+1, 'file1': file1_rows[i], 'file2': []})
        elif file1_rows[i] != file2_rows[i]:
            differences.append({'row':i+1, 'file1':file1_rows[i], 'file2': file2_rows[i]})
            
    #add any extra rows in file2 that are not in file1
    for i in range(len(file1_rows), len(file2_rows)):
        differences.append({'row': i+1, 'file1': [], 'file2': file2_rows[i]})
    
    return differences

In [4]:
diffs = compare_csv_files('out.csv', 'out_2023-05-11.csv')

In [5]:
print("Number of differences: ", len(diffs))

Number of differences:  3


In [6]:
print(diffs)

[{'row': 32, 'file1': ['10.05.23', 'Â\xa018:00', 'D2', '19', 'SGM TSV Hardthausen KoBra I', 'SGM Ilsfeld-Abstatt-Beilstein ABI II', 'www.fussball.de/export.media/-/action/getLogo/format/3/id/00ES8GNAUG0000AOVV0AG08LVUPGND5I', 'www.fussball.de/export.media/-/action/getLogo/format/3/id/00ES8GNAVO00002GVV0AG08LVUPGND5I', 'https://www.fussball.de/mannschaft/sgm-tsv-hardthausen-kobra-i-tsv-hardthausen-wuerttemberg/-/saison/2223/team-id/02IOFB8KS4000000VS5489B1VSO9MMK0', 'https://www.fussball.de/mannschaft/sgm-ilsfeld-abstatt-beilstein-abi-ii-sc-ilsfeld-wuerttemberg/-/saison/2223/team-id/011MIBO1P0000000VTVG0001VTR8C1K7', 'https://www.fussball.de/spiel/sgm-tsv-hardthausen-kobra-i-sgm-ilsfeld-abstatt-beilstein-abi-ii/-/spiel/02KCT2KSCS000000VS5489B4VU1O1RVG'], 'file2': ['20.05.23', 'Â\xa009:30', 'D2', '20', 'SGM Ilsfeld-Abstatt-Beilstein ABI II', 'TV Flein II', 'www.fussball.de/export.media/-/action/getLogo/format/3/id/00ES8GNAVO00002GVV0AG08LVUPGND5I', 'www.fussball.de/export.media/-/action/

In [9]:
import os

# Ordner mit den HTML-Seiten
folder = '../news'

# Alle Dateien im Ordner durchlaufen
for file in os.listdir(folder):
    # Nur HTML-Dateien verarbeiten
    if file.endswith('.html'):
        # Prüfen, ob das Kriterium im Dateinamen enthalten ist
        if 'B-Junioren' in file:
            # Link generieren
            link = '<a href="' + folder + file + '">' + file + '</a>'
            # Link ausgeben
            print(link)


<a href="../news230311_B-Junioren_Saisonvorbereitung.html">230311_B-Junioren_Saisonvorbereitung.html</a>
<a href="../news230319_B-Junioren_Spielbericht.html">230319_B-Junioren_Spielbericht.html</a>
<a href="../news230327_B-Junioren_Spielbericht.html">230327_B-Junioren_Spielbericht.html</a>


In [10]:
import os
import datetime

# Ordner mit HTML-Dateien
folder = '../news'

# Liste der HTML-Dateien im Ordner
html_files = [file for file in os.listdir(folder) if file.endswith('.html')]

# Liste der Dateinamen und Erstellungsdaten
files_and_dates = []

# Schleife durch die HTML-Dateien und Abrufen der Erstellungsdaten
for file in html_files:
    file_path = os.path.join(folder, file)
    created_date = datetime.datetime.fromtimestamp(os.path.getctime(file_path))
    files_and_dates.append((file, created_date))

# Liste der Dateinamen nach dem Erstellungsdatum sortieren
sorted_files = sorted(files_and_dates, key=lambda x: x[1])

# HTML-Liste der sortierten Dateinamen generieren
html_list = '<ul>\n'
for file in sorted_files:
    html_list += f'<li><a href="{file[0]}">{file[0]}</a></li>\n'
html_list += '</ul>'

# HTML-Liste ausgeben
print(html_list)


<ul>
<li><a href="230311_B-Junioren_Saisonvorbereitung.html">230311_B-Junioren_Saisonvorbereitung.html</a></li>
<li><a href="230312_A-Junioren_Zusammenfassung.html">230312_A-Junioren_Zusammenfassung.html</a></li>
<li><a href="230312_C1-Junioren_Trainingswochenende.html">230312_C1-Junioren_Trainingswochenende.html</a></li>
<li><a href="230318_A-Junioren_Spielbericht.html">230318_A-Junioren_Spielbericht.html</a></li>
<li><a href="230319_B-Junioren_Spielbericht.html">230319_B-Junioren_Spielbericht.html</a></li>
<li><a href="230319_C2-Junioren_Spezialtraining.html">230319_C2-Junioren_Spezialtraining.html</a></li>
<li><a href="230322_B2-Junioren_Spielbericht.html">230322_B2-Junioren_Spielbericht.html</a></li>
<li><a href="230326_A-Junioren_Spielbericht.html">230326_A-Junioren_Spielbericht.html</a></li>
<li><a href="230326_C-Junioren_Spielbericht.html">230326_C-Junioren_Spielbericht.html</a></li>
<li><a href="230327_B-Junioren_Spielbericht.html">230327_B-Junioren_Spielbericht.html</a></li>
<