#### Imports
<span style="font-family: Arial; font-size: 11pt;">
Der folgende Code enthält die Imports der vergangenen Saison (21/22), die für dieses Data Science-Projekt verwendet werden:

- `requests`: Diese Bibliothek ermöglicht das Senden von HTTP-Anfragen an Webseiten und die Verarbeitung der erhaltenen Daten.

- `BeautifulSoup` aus `bs4`: Diese Bibliothek wird verwendet, um HTML- oder XML-Dokumente zu parsen. Sie ermöglicht das Durchsuchen von Webseiten und das Extrahieren spezifischer Daten.

- `psycopg2`: Diese Bibliothek dient als Schnittstelle zur PostgreSQL-Datenbank. Sie ermöglicht das Herstellen von Verbindungen zur Datenbank und das Ausführen von Abfragen sowie andere Datenbankoperationen.</span>

In [None]:
import requests
from bs4 import BeautifulSoup
import psycopg2

#### Kontrollvariable
<span style="font-family: Arial; font-size: 11pt;">
In diesem Codeabschnitt haben wir die Kontrollvariable `conn_Ok` mit dem anfänglichen Wert `True` implementiert, mit der anschliessend überprüft werden soll, ob die Verbindung zur DB steht</span>

In [None]:
# Variablen
conn_Ok = True

#### DB-Verbindung
<span style="font-family: Arial; font-size: 11pt;">
Es wird mit einer Try-Except Methode versucht, eine Verbindung zur PostgreSQL-Datenbank herzustellen.
- Falls die Verbindung erfolgreich hergestellt werden kann, wird ein Cursor-Objekt erstellt und die Variable `conn_Ok` bleibt auf `True`.

Falls ein Verbindungsfehler auftritt, wird eine Fehlermeldung ausgegeben und die Variable `conn_Ok` auf `False` gesetzt.
</span>

In [None]:
# Check if connection to DB possible
try:
    connection = psycopg2.connect(
        dbname='PSQL_ADSFS2023Gruppe15',
        user='ADSFS2023Gruppe15',
        password='ADS_FS_2023_G15!?',
        host='localhost',
        port='5432'
    )

    cursor = connection.cursor()

except (Exception, psycopg2.Error) as error:
        print('Fehler beim Verbinden mit der PostgreSQL-Datenbank:', error)
        conn_Ok = False

#### Datenbereinigung
<span style="font-family: Arial; font-size: 11pt;">
Der folgende Code definiert die Funktion get_team_id, die die Team-ID anhand des Teamnamens aus der PostgreSQL-Datenbank abruft.

- Der übergebene `team_name` wird auf spezifische Teamnamen überprüft und entsprechend angepasst, um den erwarteten Namen in der Datenbank zu verwenden.
- Es wird eine SQL-Abfrage ausgeführt, um die Team-ID aus der Datenbank abzurufen.
- Das Ergebnis der Abfrage wird überprüft und entweder die Team-ID zurückgegeben oder eine Fehlermeldung ausgegeben.
</span>

In [None]:
def get_team_id(team_name):

    if team_name == 'Gladbach':
        team_name = 'Borussia Mönchengladbach'
    elif team_name == 'Hoffenheim':
        team_name = 'TSG 1899 Hoffenheim'
    elif team_name == 'Bremen':
        team_name = 'Werder Bremen'

    #Alle Teamnamen von Kicker.de anpassen auf Teamnamen in der Tabelle    
    elif team_name == 'Gladbach':
        team_name = 'Borussia Mönchengladbach'
    elif team_name == 'Hoffenheim':
        team_name = 'TSG 1899 Hoffenheim'
    elif team_name == 'Bremen':
        team_name = 'Werder Bremen'

Gladbach
Dortmund
Bayern
Frankfurt
Köln
Bielefeld
Union
Mainz
Fürth
Hertha
Freiburg
Stuttgart
Leverkusen
Leipzig
Hoffenheim
Wolfsburg
Augsburg
Bochum

Abgestiegen: Fürht und Bielefeld > ignorieren einbauen
   
        
    # Vergleicht Team Namen und sucht nach ID
    cursor.execute("SELECT team_id FROM bundesliga_mannschaften WHERE mannschaft = %s", (team_name,))
    result = cursor.fetchone()[0]

    if result:
        return result
    else:
        print(f'Keine Übereinstimmung für {team_name} gefunden')


#### Passdaten
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Passquoten von der HTML-Seite extrahiert.
- Die Team-ID wird mit Hilfe der `get_team_id()`-Funktion abgerufen.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Passdaten) in der Datenbank zu speichern.
- Die Änderungen werden anschliessend in der Datenbank gespeichert.
</span>

#### Torschüsse
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Schüsse aufs Tor von der HTML-Seite extrahiert.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Torschüsse) in der Datenbank zu speichern.
- Die Änderungen werden in der Datenbank gespeichert.
- Bei auftretenden Fehlern wird die Transaktion rückgängig gemacht und eine entsprechende Fehlermeldung ausgegeben.
</span>

#### Ballkontakte
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Ballberührungen von der HTML-Seite extrahiert.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Ballkontakte) in der Datenbank zu speichern.
- Die Änderungen werden in der Datenbank gespeichert.
- Bei auftretenden Fehlern wird die Transaktion rückgängig gemacht und eine entsprechende Fehlermeldung ausgegeben.
</span>

#### Zweikampfdaten
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Laufleistungen von der HTML-Seite extrahiert.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Zweikampfdaten) in der Datenbank zu speichern.
- Die Änderungen werden in der Datenbank gespeichert.
- Bei auftretenden Fehlern wird die Transaktion rückgängig gemacht und eine entsprechende Fehlermeldung ausgegeben.
</span>

#### Laufleistung
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Schüsse aufs Tor von der HTML-Seite extrahiert.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Laufleistung) in der Datenbank zu speichern.
- Die Änderungen werden in der Datenbank gespeichert.
- Bei auftretenden Fehlern wird die Transaktion rückgängig gemacht und eine entsprechende Fehlermeldung ausgegeben.
</span>

#### Freistösse
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Schüsse aufs Tor von der HTML-Seite extrahiert.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Freistösse) in der Datenbank zu speichern.
- Die Änderungen werden in der Datenbank gespeichert.
- Bei auftretenden Fehlern wird die Transaktion rückgängig gemacht und eine entsprechende Fehlermeldung ausgegeben.
</span>

#### Eckbälle
<span style="font-family: Arial; font-size: 11pt;">

Der folgende Codeabschnitt durchläuft eine Schleife von 1 bis 35 (Spieltage) und ruft Daten von einer Webseite ab.

- Eine URL wird für jeden Spieltag generiert, um Daten von einer bestimmten Webseite abzurufen.
- Eine HTTP-Anfrage wird an die URL gesendet, um die Webseite abzurufen.
- Wenn die Antwort erfolgreich ist (200), werden relevante Informationen wie Mannschaftsnamen und Schüsse aufs Tor von der HTML-Seite extrahiert.
- Ein SQL-INSERT-Statement wird erstellt, um die Daten (Spieltag, Team-ID und Eckbälle) in der Datenbank zu speichern.
- Die Änderungen werden in der Datenbank gespeichert.
- Bei auftretenden Fehlern wird die Transaktion rückgängig gemacht und eine entsprechende Fehlermeldung ausgegeben.
</span>