In [1]:
import csv

In [2]:
def compare_csv_files(file1, file2):
    """
    Compare two CSV files and return a list of differences between them.
    
    Parameters:
    file1 (str): Path to the first CSV file
    file2 (str): path to the second CSV file
    
    Returns:
    list: A list of dictionaries, where each dictionary represents a row that is different between the two CSV files.
    """
    
    #read the content of both files
    with open(file1, 'r') as f1, open(file2, 'r') as f2:
        reader1 = csv.reader(f1)
        reader2 = csv.reader(f2)
        file1_rows = [row for row in reader1]
        file2_rows = [row for row in reader2]
        
    #compare the rows in both files
    differences = []
    for i in range(len(file1_rows)):
        if i >= len(file2_rows):
            differences.append({'row': i+1, 'file1': file1_rows[i], 'file2': []})
        elif file1_rows[i] != file2_rows[i]:
            differences.append({'row':i+1, 'file1':file1_rows[i], 'file2': file2_rows[i]})
            
    #add any extra rows in file2 that are not in file1
    for i in range(len(file1_rows), len(file2_rows)):
        differences.append({'row': i+1, 'file1': [], 'file2': file2_rows[i]})
    
    return differences

In [3]:
diffs = compare_csv_files('out.csv', 'out_2023-05-11.csv')

In [4]:
print("Number of differences: ", len(diffs))

Number of differences:  3


In [21]:
import pandas as pd

tab1 = pd.read_csv('out_2023-05-11.csv')
tab2 = pd.read_csv('out_old.csv')
unterschiede = tab1.compare(tab2)
print(unterschiede)
tab2.head()

Empty DataFrame
Columns: []
Index: []


Unnamed: 0,Datum,Zeit,Team,KW,Heim,Gast,Logo Heim,Logo Gast,home_link,guest_link,Spiel
0,13.05.23,16:15,A,19,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,Aramäer Heilbronn,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/mannschaft/aramaeer-he...,https://www.fussball.de/spiel/sgm-sc-abstatt-b...
1,20.05.23,16:15,A,20,Türkspor Neckarsulm,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/tuerkspor-n...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/spiel/tuerkspor-neckar...
2,14.06.23,19:00,A,24,TSV Talheim,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/tsv-talheim...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/spiel/tsv-talheim-sgm-...
3,17.06.23,16:15,A,24,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,SGM TSV Brettach KoBra,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/mannschaft/sgm-tsv-bre...,https://www.fussball.de/spiel/sgm-sc-abstatt-b...
4,14.05.23,10:30,B1,19,SGM TGV Eintracht Beilstein/​Abstatt/​Ilsfeld ...,SGM TSV Hardthausen KoBra,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/sgm-tgv-ein...,https://www.fussball.de/mannschaft/sgm-tsv-har...,https://www.fussball.de/spiel/sgm-tgv-eintrach...


In [12]:
tab2.head()

Unnamed: 0,Datum,Zeit,Team,KW,Heim,Gast,Logo Heim,Logo Gast,home_link,guest_link,Spiel
0,13.05.23,16:15,A,19,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,Aramäer Heilbronn,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/mannschaft/aramaeer-he...,https://www.fussball.de/spiel/sgm-sc-abstatt-b...
1,20.05.23,16:15,A,20,Türkspor Neckarsulm,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/tuerkspor-n...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/spiel/tuerkspor-neckar...
2,14.06.23,19:00,A,24,TSV Talheim,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/tsv-talheim...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/spiel/tsv-talheim-sgm-...
3,17.06.23,16:15,A,24,SGM SC Abstatt/​Beilstein/​Ilsfeld ABI,SGM TSV Brettach KoBra,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/sgm-sc-abst...,https://www.fussball.de/mannschaft/sgm-tsv-bre...,https://www.fussball.de/spiel/sgm-sc-abstatt-b...
4,14.05.23,10:30,B1,19,SGM TGV Eintracht Beilstein/​Abstatt/​Ilsfeld ...,SGM TSV Hardthausen KoBra,www.fussball.de/export.media/-/action/getLogo/...,www.fussball.de/export.media/-/action/getLogo/...,https://www.fussball.de/mannschaft/sgm-tgv-ein...,https://www.fussball.de/mannschaft/sgm-tsv-har...,https://www.fussball.de/spiel/sgm-tgv-eintrach...


In [9]:
import os

# Ordner mit den HTML-Seiten
folder = '../news'

# Alle Dateien im Ordner durchlaufen
for file in os.listdir(folder):
    # Nur HTML-Dateien verarbeiten
    if file.endswith('.html'):
        # Prüfen, ob das Kriterium im Dateinamen enthalten ist
        if 'B-Junioren' in file:
            # Link generieren
            link = '<a href="' + folder + file + '">' + file + '</a>'
            # Link ausgeben
            print(link)


<a href="../news230311_B-Junioren_Saisonvorbereitung.html">230311_B-Junioren_Saisonvorbereitung.html</a>
<a href="../news230319_B-Junioren_Spielbericht.html">230319_B-Junioren_Spielbericht.html</a>
<a href="../news230327_B-Junioren_Spielbericht.html">230327_B-Junioren_Spielbericht.html</a>


In [10]:
import os
import datetime

# Ordner mit HTML-Dateien
folder = '../news'

# Liste der HTML-Dateien im Ordner
html_files = [file for file in os.listdir(folder) if file.endswith('.html')]

# Liste der Dateinamen und Erstellungsdaten
files_and_dates = []

# Schleife durch die HTML-Dateien und Abrufen der Erstellungsdaten
for file in html_files:
    file_path = os.path.join(folder, file)
    created_date = datetime.datetime.fromtimestamp(os.path.getctime(file_path))
    files_and_dates.append((file, created_date))

# Liste der Dateinamen nach dem Erstellungsdatum sortieren
sorted_files = sorted(files_and_dates, key=lambda x: x[1])

# HTML-Liste der sortierten Dateinamen generieren
html_list = '<ul>\n'
for file in sorted_files:
    html_list += f'<li><a href="{file[0]}">{file[0]}</a></li>\n'
html_list += '</ul>'

# HTML-Liste ausgeben
print(html_list)


<ul>
<li><a href="230311_B-Junioren_Saisonvorbereitung.html">230311_B-Junioren_Saisonvorbereitung.html</a></li>
<li><a href="230312_A-Junioren_Zusammenfassung.html">230312_A-Junioren_Zusammenfassung.html</a></li>
<li><a href="230312_C1-Junioren_Trainingswochenende.html">230312_C1-Junioren_Trainingswochenende.html</a></li>
<li><a href="230318_A-Junioren_Spielbericht.html">230318_A-Junioren_Spielbericht.html</a></li>
<li><a href="230319_B-Junioren_Spielbericht.html">230319_B-Junioren_Spielbericht.html</a></li>
<li><a href="230319_C2-Junioren_Spezialtraining.html">230319_C2-Junioren_Spezialtraining.html</a></li>
<li><a href="230322_B2-Junioren_Spielbericht.html">230322_B2-Junioren_Spielbericht.html</a></li>
<li><a href="230326_A-Junioren_Spielbericht.html">230326_A-Junioren_Spielbericht.html</a></li>
<li><a href="230326_C-Junioren_Spielbericht.html">230326_C-Junioren_Spielbericht.html</a></li>
<li><a href="230327_B-Junioren_Spielbericht.html">230327_B-Junioren_Spielbericht.html</a></li>
<