In [48]:
import psycopg2
from configparser import ConfigParser

def config(filename='db_config.ini', section='postgresql'):
    parser = ConfigParser()
    parser.read(filename)

    db_params = {}
    if parser.has_section(section):
        params = parser.items(section)
        for param in params:
            db_params[param[0]] = param[1]
    else:
        raise Exception(f'Section {section} not found in the {filename} file')
    
    return db_params

try:
    params = config()
    conn = psycopg2.connect(**params)
    print("Erfolgreich zur Datenbank verbunden!")
except Exception as e:
    print("Konnte keine Verbindung zur Datenbank herstellen!")
    print(e)



Erfolgreich zur Datenbank verbunden!


In [45]:
import psycopg2

try:
    cur = conn.cursor()

    try:
        # Rolle erstellen
        cur.execute("CREATE ROLE xxx WITH LOGIN PASSWORD 'xx';")
        conn.commit()
    except Exception as e:
        conn.rollback()
        print(f"Ein Fehler ist aufgetreten: {e}")

    try:
        cur.execute("GRANT ALL PRIVILEGES ON DATABASE db5 TO xx;")
        conn.commit()
    except Exception as e:
        conn.rollback()
        print(f"Ein Fehler ist aufgetreten: {e}")
    cur.close()
    conn.close()

except psycopg2.Error as e:
    print(f"Ein Verbindungsfehler ist aufgetreten: {e}")



In [28]:
conn.close()

In [49]:
# SQL-Abfragen als Strings
create_movies_sql = """
DROP TABLE IF EXISTS movies;
CREATE TABLE movies (
movieid BIGSERIAL PRIMARY KEY,
title VARCHAR,
genres VARCHAR
);
"""

create_tags_sql = """
DROP TABLE IF EXISTS tags;
CREATE TABLE tags (
tagid BIGSERIAL PRIMARY KEY,
userid BIGINT,
movieid BIGINT,
tag VARCHAR,
timestamp BIGINT
);
"""

create_ratings_sql = """
DROP TABLE IF EXISTS ratings;
CREATE TABLE ratings (
ratingid BIGSERIAL PRIMARY KEY,
user_id BIGINT,
movie_id BIGINT,
rating REAL,
timestamp BIGINT
);
"""

# Erstellen Sie einen Cursor und führen Sie die SQL-Abfragen aus
try:
    with conn.cursor() as cursor:
        cursor.execute(create_movies_sql)
        print("Die Tabelle 'movies' wurde erfolgreich erstellt.")
        cursor.execute(create_tags_sql)
        print("Die Tabelle 'tags' wurde erfolgreich erstellt.")
        cursor.execute(create_ratings_sql)
        print("Die Tabelle 'ratings' wurde erfolgreich erstellt.")
    conn.commit()
except Exception as e:
    print(f"Fehler beim Erstellen der Tabellen: {e}")

# Schließen Sie die Verbindung
conn.close()


Fehler beim Erstellen der Tabellen: must be owner of table movies



In [None]:
import pandas as pd
from sqlalchemy import create_engine

# Erstellen Sie eine SQLAlchemy-Engine mit der gleichen Datenbankverbindung
engine = create_engine('postgresql://doadmin:AVNS_XJH8N5tjfLwWkcqMA-B@db-postgresql-fra1-04393-do-user-7258468-0.b.db.ondigitalocean.com:25060/defaultdb')

# Lesen Sie die CSV-Dateien und schreiben Sie sie in die Datenbank
try:
    for table in ['movies', 'tags', 'ratings']:
        df = pd.read_csv(f'ml-25m/{table}.csv')
        df.to_sql(table, engine, if_exists='append', index=False)  # 'append' fügt die Daten in die vorhandene Tabelle ein.
        print(f"Daten wurden erfolgreich in die Tabelle '{table}' importiert.")
except Exception as e:
    print(f"Fehler beim Importieren der Daten: {e}")


In [19]:
import pandas as pd
from sqlalchemy import create_engine

# Erstellen eine SQLAlchemy-Engine mit der bestehenden Verbindung
engine = create_engine('postgresql://', creator=lambda: conn)

with conn.cursor() as cur:
    cur.execute("SELECT setval('movies_movie_id_seq', (SELECT MAX(movie_id) FROM movies))")
conn.commit()


try:
    for table in ['movies', 'tags', 'ratings']:
        df = pd.read_csv(f'ml-25m/{table}.csv')
        if 'movieId' in df.columns:
            df = df.rename(columns={'movieId': 'movie_id'})
        if 'userId' in df.columns:
            df = df.rename(columns={'userId': 'user_id'})
        if 'tagId' in df.columns:
            df = df.rename(columns={'tagId': 'tag_id'})
        if 'ratingId' in df.columns:
            df = df.rename(columns={'ratingId': 'rating_id'})
        if 'movie_id' in df.columns:
            df = df.drop(columns=['movie_id'])

        df = df.head(100)

        df.to_sql(table, engine, if_exists='append', index=False)
        print(f"Daten wurden erfolgreich in die Tabelle '{table}' importiert.")
except Exception as e:
    print(f"Fehler beim Importieren der Daten: {e}")




Daten wurden erfolgreich in die Tabelle 'movies' importiert.
Daten wurden erfolgreich in die Tabelle 'tags' importiert.
Daten wurden erfolgreich in die Tabelle 'ratings' importiert.


In [None]:
conn.close()
