## Запись данных наблюдений

In [1]:
import csv
from datetime import datetime
import psycopg2

In [2]:
#!!!
def get_datasets():
    datasets = {
        'Неман-Белица': 'Неман',
        'Неман-Гродно': 'Неман',
        'Неман-Мосты': 'Неман',
        'Неман-Столбцы': 'Неман',

        'Вилия-Стешицы': 'Вилия',
        'Вилия-Михалишки': 'Вилия',

        'ЗападнаяДвина-Сураж': 'ЗападнаяДвина-А',
        'ЗападнаяДвина-Верхнедвинск': 'ЗападнаяДвина-А',
        'ЗападнаяДвина-Витебск': 'ЗападнаяДвина-Б',
        'ЗападнаяДвина-Полоцк': 'ЗападнаяДвина-Б',
    }
    return datasets

### Функция выборки гидропостов и их кодов из БД

In [3]:
def get_stations_db():
    db_params = {
        "host": "192.168.29.134",
        "database": "pkogo",
        "user": "pkogouser",
        "password": "pkogouser",
        "port": "5432"
    }
    try:
        conn = psycopg2.connect(**db_params)
        cursor = conn.cursor()
        print(cursor)
        print("DB connection works")
    except (Exception, psycopg2.Error) as error:
        print(f"Error connecting to database: {error}")


    sql = "SELECT station, station_id FROM maxlevel.STATIONS"
    cursor.execute(sql)
    result = cursor.fetchall()
    # print(result)

    if conn:
        cursor.close()
        conn.close()

    return {station: id for station, id in result}

In [4]:
get_stations_db()

<cursor object at 0x00000153FD95B300; closed: 0>
DB connection works


{'Сураж': 73111,
 'Витебск': 73115,
 'Полоцк': 73122,
 'Столбцы': 74014,
 'Белица': 74021,
 'Мосты': 74024,
 'Гродно': 74032,
 'Стешицы': 74198,
 'Михалишки': 74205,
 'Верхнедвинск': 73131}

#### Функция чтения набора данных

In [5]:
# !!!
def write_dataset_db(year, dataset, db_connection, db_cursor):
    # Путь к csv-файлу
    ds_dir = f'data/{year}/Train'    
    fname = f'{ds_dir}/{dataset}.csv'

    # Извлечение название гидропоста из названия датасета,
    # например датасет Вилия-Михалишки, тогда гидропост Михалишки
    station = dataset.split('-')[1]
    
    # Извлечение из БД названий станций и их id (словарь)
    stations = get_stations_db()
    station_id = stations[station]
    
    print(f'fname==\n{fname}')
    with open(fname, newline='') as f: 
        reader = csv.DictReader(f, delimiter=';')
        # Прочитать заголовки
        fieldnames_list = ['station_id'] + reader.fieldnames
        fieldnames = ', '.join(fieldnames_list).replace('year', 'obs_year')
        print(f'fieldnames==\n{fieldnames}')

               
        # Создать плейсхолдер для sql
        placeholders = ', '.join([f'%({c})s' for c in fieldnames_list])
        print(f'placeholders==\n{placeholders}')

        sql = f"""
        INSERT INTO maxlevel.observations ({fieldnames}) 
        VALUES ({placeholders})
        """
        print(f'sql==\n{sql}')

        ## Запись в таблицу Observations
        for row in reader:
            # Преобразование строк-дат в datetime
            for k in row:
                if 'd_' in k:
                    row[k] = datetime.strptime(row[k], '%d.%m.%Y')
                else:
                    row[k] = float(row[k])
            print(f'row==\n{row}')
            db_row = {'station_id': station_id} | row
            print(f'db_row==\n{db_row}')
            db_cursor.execute(sql, db_row)

        db_connection.commit()


In [6]:
def write_observations_db(year):

    db_params = {
        "host": "192.168.29.134",
        "database": "pkogo",
        "user": "pkogouser",
        "password": "pkogouser",
        "port": "5432"
    }
    try:
        conn = psycopg2.connect(**db_params)
        cursor = conn.cursor()
        print(cursor)
        print("DB connection works")
    except (Exception, psycopg2.Error) as error:
        print(f"Error connecting to database: {error}")
    
    # Удаление ВСЕХ строк из таблицы
    cursor.execute("DELETE FROM maxlevel.observations")
    conn.commit()
    
    # Итерация по датасетам
    datasets = get_datasets()
    for ds in datasets:            
        write_dataset_db(year, ds, conn, cursor)

    if conn:
        cursor.close()
        conn.close()

In [7]:
_ = write_observations_db(2024)

<cursor object at 0x00000153FD95B300; closed: 0>
DB connection works
<cursor object at 0x00000153FD95B680; closed: 0>
DB connection works
fname==
data/2024/Train/Неман-Белица.csv
fieldnames==
station_id, obs_year, d_0, S_2802, Smax, d_smax, H_2802, H_max, d_hmax, X, X1, X2, X3, Xs
placeholders==
%(station_id)s, %(year)s, %(d_0)s, %(S_2802)s, %(Smax)s, %(d_smax)s, %(H_2802)s, %(H_max)s, %(d_hmax)s, %(X)s, %(X1)s, %(X2)s, %(X3)s, %(Xs)s
sql==

        INSERT INTO maxlevel.observations (station_id, obs_year, d_0, S_2802, Smax, d_smax, H_2802, H_max, d_hmax, X, X1, X2, X3, Xs) 
        VALUES (%(station_id)s, %(year)s, %(d_0)s, %(S_2802)s, %(Smax)s, %(d_smax)s, %(H_2802)s, %(H_max)s, %(d_hmax)s, %(X)s, %(X1)s, %(X2)s, %(X3)s, %(Xs)s)
        
row==
{'year': 1977.0, 'd_0': datetime.datetime(1976, 12, 12, 0, 0), 'S_2802': 22.0, 'Smax': 47.0, 'd_smax': datetime.datetime(1977, 2, 20, 0, 0), 'H_2802': 227.0, 'H_max': 281.0, 'd_hmax': datetime.datetime(1977, 4, 18, 0, 0), 'X': 49.0, 'X1': 112.0,