<a href="https://colab.research.google.com/github/bennyb-bio/Group-A-Project/blob/main/Untitled3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [4]:
import sqlite3
import pandas as pd
import os

# Google Drive mounten
from google.colab import drive
drive.mount("/content/drive")

# Verzeichnis mit den CSV-Dateien
material_path = "/content/drive/MyDrive/Gruppe A/COVID 19 data"
!ls "{material_path}"

# Name der SQLite-Datenbank
database_file = "covid19_data.db"

try:
    # Verbindung zur SQLite-Datenbank herstellen
    conn = sqlite3.connect(database_file)
    cursor = conn.cursor()

    # Fremdschlüssel aktivieren
    cursor.execute("PRAGMA foreign_keys = ON;")

    # Tabellen erstellen und Daten importieren
    table_creation_queries = {
        "observations": """
            CREATE TABLE IF NOT EXISTS observations (
                DATE TEXT,
                PATIENT TEXT,
                ENCOUNTER TEXT,
                CODE TEXT,
                DESCRIPTION TEXT,
                VALUE TEXT,
                UNITS TEXT,
                TYPE TEXT,
                FOREIGN KEY (PATIENT)
                  REFERENCES patients (Id)
            );
        """,
        "patients": """
            CREATE TABLE IF NOT EXISTS patients (
                Id TEXT PRIMARY KEY,
                BIRTHDATE TEXT,
                DEATHDATE TEXT,
                SSN TEXT,
                DRIVERS TEXT,
                PASSPORT TEXT,
                PREFIX TEXT,
                FIRST TEXT,
                LAST TEXT,
                SUFFIX TEXT,
                MAIDEN TEXT,
                MARITAL TEXT,
                RACE TEXT,
                ETHNICITY TEXT,
                GENDER TEXT,
                BIRTHPLACE TEXT,
                ADDRESS TEXT,
                CITY TEXT,
                STATE TEXT,
                COUNTRY TEXT,
                ZIP TEXT,
                LAT REAL,
                LON REAL,
                HEALTHCARE_EXPENSES REAL,
                HEALTHCARE_COVERAGE REAL
            );
        """,
        "conditions": """
            CREATE TABLE IF NOT EXISTS conditions (
                START TEXT,
                STOP TEXT,
                PATIENT TEXT,
                ENCOUNTER TEXT,
                CODE TEXT,
                DESCRIPTION TEXT,
                FOREIGN KEY (PATIENT)
                  REFERENCES patients (Id)
            );
        """
    }

    csv_files = {
        f"{material_path}/observations.csv": "observations",
        f"{material_path}/patients.csv": "patients",
        f"{material_path}/conditions.csv": "conditions"
    }

    for csv_file, table_name in csv_files.items():
        # Tabelle erstellen
        try:
            print(f"Erstelle Tabelle: {table_name}")
            cursor.execute(table_creation_queries[table_name])
            conn.commit()
        except Exception as e:
            print(f"[FEHLER] Tabelle '{table_name}' konnte nicht erstellt werden: {e}")
            continue

        # CSV-Datei prüfen und Daten importieren
        if not os.path.exists(csv_file):
            print(f"[WARNUNG] Die Datei {csv_file} existiert nicht.")
            continue

        try:
            df = pd.read_csv(csv_file)
            print(f"Importiere Daten in die Tabelle {table_name}...")
            df.to_sql(table_name, conn, if_exists="replace", index=False)
        except Exception as e:
            print(f"[FEHLER] Import in Tabelle '{table_name}' fehlgeschlagen: {e}")

    print(f"Die Daten wurden erfolgreich in die Datenbank '{database_file}' importiert.")

except Exception as e:
    print(f"Ein Fehler ist aufgetreten: {e}")

finally:
    if conn:
        print("Schließe die Datenbankverbindung.")
        conn.close()


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
careplans.csv	 devices.csv	  imaging_studies.csv	observations.csv   payers.csv
careplans.xlsx	 disease.csv	  imaging_studies.xlsx	observations.xlsx  payer_transitions.csv
conditions.csv	 disease.xlsx	  immunizations.csv	organizations.csv  procedures.csv
conditions.xlsx  encounters.csv   medications.csv	patients.csv	   providers.csv
covid19_test.db  encounters.xlsx  medications.xlsx	patients.xlsx	   supplies.csv
Erstelle Tabelle: observations
Importiere Daten in die Tabelle observations...
Erstelle Tabelle: patients
Importiere Daten in die Tabelle patients...
Erstelle Tabelle: conditions
Importiere Daten in die Tabelle conditions...
Die Daten wurden erfolgreich in die Datenbank 'covid19_data.db' importiert.
Schließe die Datenbankverbindung.


In [5]:
import sqlite3
import pandas as pd

def reopen_and_inspect_database(db_file):
    """
    Öffnet die Verbindung zu einer SQLite-Datenbank, listet die vorhandenen Tabellen
    und zeigt die ersten Zeilen (max. 5) jeder Tabelle an.
    """
    try:
        # Verbindung zur Datenbank herstellen
        conn = sqlite3.connect(db_file)
        cursor = conn.cursor()

        # Tabellen abfragen
        cursor.execute("SELECT name FROM sqlite_master WHERE type='table';")
        tables = cursor.fetchall()

        if not tables:
            print("Die Datenbank enthält keine Tabellen.")
            return

        print(f"Tabellen in der Datenbank '{db_file}':")
        for table in tables:
            table_name = table[0]
            print(f"\nTabelle: {table_name}")

            # Inhalte der Tabelle abfragen
            query = f"SELECT * FROM {table_name} LIMIT 5;"  # Zeigt die ersten 5 Zeilen an
            try:
                df = pd.read_sql_query(query, conn)
                if df.empty:
                    print(f"Die Tabelle '{table_name}' ist leer.")
                else:
                    print(f"Inhalt der Tabelle '{table_name}':")
                    print(df)
            except Exception as e:
                print(f"Fehler beim Abrufen der Daten aus der Tabelle '{table_name}': {e}")

    except sqlite3.Error as e:
        print(f"Fehler beim Zugriff auf die Datenbank: {e}")
    finally:
        if conn:
            conn.close()
            print("Datenbankverbindung geschlossen.")

# Name der SQLite-Datenbank
database_file = "covid19_data.db"

# Funktion ausführen
reopen_and_inspect_database(database_file)


Tabellen in der Datenbank 'covid19_data.db':

Tabelle: observations
Inhalt der Tabelle 'observations':
                   DATE                               PATIENT  \
0  2020-02-17T21:57:21Z  ad5525c0-fdab-94dc-018f-d7209c72bdef   
1  2020-02-17T21:57:21Z  ad5525c0-fdab-94dc-018f-d7209c72bdef   
2  2020-02-17T21:57:21Z  ad5525c0-fdab-94dc-018f-d7209c72bdef   
3  2020-02-17T21:57:21Z  ad5525c0-fdab-94dc-018f-d7209c72bdef   
4  2020-02-17T21:57:21Z  ad5525c0-fdab-94dc-018f-d7209c72bdef   

                              ENCOUNTER    CODE  \
0  1d453a83-17f7-490d-5576-09f5725cdcaa  8310-5   
1  1d453a83-17f7-490d-5576-09f5725cdcaa  9279-1   
2  1d453a83-17f7-490d-5576-09f5725cdcaa  8867-4   
3  1d453a83-17f7-490d-5576-09f5725cdcaa  2708-6   
4  1d453a83-17f7-490d-5576-09f5725cdcaa  8462-4   

                           DESCRIPTION VALUE   UNITS     TYPE  
0                     Body temperature  41.4     Cel  numeric  
1                     Respiratory rate  21.4    /min  numeric  
2      