In [1]:
!pip install sqlalchemy
!pip install psycopg2-binary

Defaulting to user installation because normal site-packages is not writeable
Defaulting to user installation because normal site-packages is not writeable


In [2]:
import pandas as pd
from sqlalchemy import create_engine
import psycopg2

In [None]:
db_config = {
    "host": "localhost",
    "port": "5432",
    "dbname": "medical_db",
    "user": "postgres",
    "password": "123"
}

sql_script = """
CREATE TABLE legal_entities (
    id SERIAL PRIMARY KEY,
    name TEXT,
    bin VARCHAR,
    organization_type VARCHAR
);

CREATE TABLE ownership_forms (
    id SERIAL PRIMARY KEY,
    name VARCHAR
);

CREATE TABLE regions (
    id SERIAL PRIMARY KEY,
    name VARCHAR
);

CREATE TABLE healthcare_entity_statuses (
    id SERIAL PRIMARY KEY,
    name VARCHAR
);

CREATE TABLE provider_help_types (
    id SERIAL PRIMARY KEY,
    name TEXT
);

CREATE TABLE provider_help_subtypes (
    id SERIAL PRIMARY KEY,
    name TEXT,
    provider_help_type_id INT REFERENCES provider_help_types(id)
);

CREATE TABLE coexecutor_help_types (
    id SERIAL PRIMARY KEY,
    name TEXT
);

CREATE TABLE coexecutor_help_subtypes (
    id SERIAL PRIMARY KEY,
    name TEXT,
    coexecutor_help_type_id INT REFERENCES coexecutor_help_types(id)
);

CREATE TABLE healthcare_details (
    id SERIAL PRIMARY KEY,
    legal_entity_id INT REFERENCES legal_entities(id),
    is_long_term_contract BOOLEAN,
    ownership_form_id INT REFERENCES ownership_forms(id),
    region_id INT REFERENCES regions(id),
    date_inclusion DATE,
    date_exclusion DATE,
    date_change DATE,
    provider_help_subtype_id INT REFERENCES provider_help_subtypes(id),
    coexecutor_help_subtype_id INT REFERENCES coexecutor_help_subtypes(id),
    entity_status_id INT REFERENCES healthcare_entity_statuses(id),
    is_db_included BOOLEAN
);

CREATE TABLE procurement_statuses (
    id SERIAL PRIMARY KEY,
    name VARCHAR
);

CREATE TABLE purchase_methods (
    id SERIAL PRIMARY KEY,
    name VARCHAR
);

CREATE TABLE item_types (
    id SERIAL PRIMARY KEY,
    name VARCHAR
);

CREATE TABLE organizers (
    id SERIAL PRIMARY KEY,
    legal_entity_id INT REFERENCES legal_entities(id)
);

CREATE TABLE announcements (
    id SERIAL PRIMARY KEY,
    organizer_id INT REFERENCES organizers(id),
    name TEXT,
    purchase_method_id INT REFERENCES purchase_methods(id),
    item_type_id INT REFERENCES item_types(id),
    application_start TIMESTAMP,
    application_end TIMESTAMP,
    lot_count INT,
    total_sum DECIMAL,
    status_id INT REFERENCES procurement_statuses(id)
);

CREATE TABLE customers (
    id SERIAL PRIMARY KEY,
    legal_entity_id INT REFERENCES legal_entities(id)
);

CREATE TABLE lots (
    id SERIAL PRIMARY KEY,
    announcement_id INT REFERENCES announcements(id),
    customer_id INT REFERENCES customers(id),
    medicine_name VARCHAR,
    purchase_method_id INT REFERENCES purchase_methods(id),
    plan_month VARCHAR,
    unit_quantity VARCHAR,
    price DECIMAL,
    total_sum DECIMAL,
    status_id INT REFERENCES procurement_statuses(id),
    application_count INT
);

CREATE TABLE participants (
    id SERIAL PRIMARY KEY,
    legal_entity_id INT REFERENCES legal_entities(id)
);

"""

try:
    conn = psycopg2.connect(**db_config)
    conn.autocommit = True  
    cursor = conn.cursor()
    cursor.execute(sql_script)
except Exception as e:
    print("Ошибка при выполнении SQL:", e)
finally:
    if cursor:
        cursor.close()
    if conn:
        conn.close()

In [3]:
engine = create_engine("postgresql+psycopg2://postgres:123@localhost:5432/medical_db")

In [4]:
file_path = r"C:\Users\Айгерим\Downloads\база_данных_субъектов_здравоохранения.csv"
df_health = pd.read_csv(file_path)

unique_regions = pd.DataFrame(df_health['Регион, населению которого будут оказываться услуги'].dropna().unique(), columns=['name'])
unique_regions.to_sql('regions', engine, if_exists='append', index=False)

print("Таблица regions успешно заполнена!")

Таблица regions успешно заполнена!


In [5]:
file_path = r"C:\Users\Айгерим\Downloads\база_данных_субъектов_здравоохранения.csv"
df_health = pd.read_csv(file_path)

unique_ownership = pd.DataFrame(df_health['Форма собственности субъекта здравоохранения'].dropna().unique(), columns=['name'])
unique_ownership.to_sql('ownership_forms', engine, if_exists='append', index=False)

print("Таблица ownership_forms успешно заполнена!")

Таблица ownership_forms успешно заполнена!


In [6]:
file_path = r"C:\Users\Айгерим\Downloads\база_данных_субъектов_здравоохранения.csv"
df_health = pd.read_csv(file_path)

unique_statuses = pd.DataFrame(df_health['Статус субъекта здравоохранения'].dropna().unique(), columns=['name'])
unique_statuses.to_sql('healthcare_entity_statuses', engine, if_exists='append', index=False)

print("Таблица healthcare_entity_statuses успешно заполнена!")

Таблица healthcare_entity_statuses успешно заполнена!


In [8]:
file_path = r"C:\Users\Айгерим\Downloads\база_данных_субъектов_здравоохранения.csv"
df = pd.read_csv(file_path)

provider_pairs = df[['Вид/Форма медицинской помощи (Поставщик)', 
                     'Подвида вида/формы медицинской помощи (Поставщик)']].dropna().drop_duplicates()

provider_types = pd.DataFrame(provider_pairs['Вид/Форма медицинской помощи (Поставщик)'].unique(), columns=['name'])
provider_types.to_sql('provider_help_types', engine, if_exists='append', index=False)

with engine.connect() as conn:
    provider_type_df = pd.read_sql("SELECT * FROM provider_help_types", conn)

provider_pairs = provider_pairs.merge(provider_type_df, left_on='Вид/Форма медицинской помощи (Поставщик)', right_on='name')
provider_subtypes = provider_pairs[['Подвида вида/формы медицинской помощи (Поставщик)', 'id']]
provider_subtypes.columns = ['name', 'provider_help_type_id']
provider_subtypes.to_sql('provider_help_subtypes', engine, if_exists='append', index=False)

print("Таблицы provider_help_types и provider_help_subtypes успешно заполнены!")

coexecutor_pairs = df[['Вид/Форма медицинской помощи (Соисполнитель)', 
                       'Подвида вида/формы медицинской помощи (Соисполнитель)']].dropna().drop_duplicates()

coexecutor_types = pd.DataFrame(coexecutor_pairs['Вид/Форма медицинской помощи (Соисполнитель)'].unique(), columns=['name'])
coexecutor_types.to_sql('coexecutor_help_types', engine, if_exists='append', index=False)

with engine.connect() as conn:
    coexecutor_type_df = pd.read_sql("SELECT * FROM coexecutor_help_types", conn)

coexecutor_pairs = coexecutor_pairs.merge(coexecutor_type_df, left_on='Вид/Форма медицинской помощи (Соисполнитель)', right_on='name')
coexecutor_subtypes = coexecutor_pairs[['Подвида вида/формы медицинской помощи (Соисполнитель)', 'id']]
coexecutor_subtypes.columns = ['name', 'coexecutor_help_type_id']
coexecutor_subtypes.to_sql('coexecutor_help_subtypes', engine, if_exists='append', index=False)

print("Таблицы coexecutor_help_types и coexecutor_help_subtypes успешно заполнены!")

Таблицы provider_help_types и provider_help_subtypes успешно заполнены!
Таблицы coexecutor_help_types и coexecutor_help_subtypes успешно заполнены!


In [9]:
file_path = r"C:\Users\Айгерим\Downloads\база_данных_субъектов_здравоохранения.csv"
df_health = pd.read_csv(file_path)

if "Тип организации" not in df_health.columns:
    df_health["Тип организации"] = "Субъект здравоохранения"

df_legal = df_health[['Наименование субъекта здравоохранения', 'БИН/ИИН', 'Тип организации']].drop_duplicates()
df_legal.columns = ['name', 'bin', 'organization_type']
df_legal = df_legal.dropna(subset=['name'])
df_legal['id'] = range(1, len(df_legal) + 1)

df_legal = df_legal[['id', 'name', 'bin', 'organization_type']]
df_legal.to_sql('legal_entities', engine, if_exists='append', index=False)

print("Таблица legal_entities(субъект здравоохранения) успешно заполнена!")

Таблица legal_entities(субъект здравоохранения) успешно заполнена!


In [10]:
from sqlalchemy import create_engine, text 
file_path = r"C:\Users\Айгерим\Downloads\база_данных_субъектов_здравоохранения.csv"
df = pd.read_csv(file_path)

def parse_yes_no(val):
    val = str(val).strip().lower()
    if val == 'да':
        return True
    elif val == 'нет':
        return False
    return None

def parse_db_status(val):
    val = str(val).strip().lower()
    if val == 'включен в бд':
        return True
    elif val == 'исключен из бд':
        return False
    return None

df['is_long_term_contract'] = df['На заключение долгосрочного договора'].apply(parse_yes_no)
df['is_db_included'] = df['Статус'].apply(parse_db_status)

df_ = df.rename(columns={
    'Наименование субъекта здравоохранения': 'name',
    'БИН/ИИН': 'bin',
    'Форма собственности субъекта здравоохранения': 'ownership_form_name',
    'Регион, населению которого будут оказываться услуги': 'region_name',
    'Дата включения в базу данных': 'date_inclusion',
    'Дата исключения из базы данных': 'date_exclusion',
    'Дата последнего изменения': 'date_change',
    'Вид/Форма медицинской помощи (Поставщик)': 'provider_help_type_name',
    'Подвида вида/формы медицинской помощи (Поставщик)': 'provider_help_subtype_name',
    'Вид/Форма медицинской помощи (Соисполнитель)': 'coexecutor_help_type_name',
    'Подвида вида/формы медицинской помощи (Соисполнитель)': 'coexecutor_help_subtype_name',
    'Статус субъекта здравоохранения': 'entity_status_name'
})

def get_id(table, name_value):
    if pd.isna(name_value):
        return None
    with engine.connect() as conn:
        result = conn.execute(text(f"SELECT id FROM {table} WHERE name = :name"), {'name': name_value}).fetchone()
        return result[0] if result else None

def get_legal_entity_id(name, bin_):
    if pd.isna(name) or pd.isna(bin_):
        return None
    with engine.connect() as conn:
        result = conn.execute(text(
            "SELECT id FROM legal_entities WHERE name = :name AND bin = :bin"
        ), {'name': name, 'bin': str(bin_)}).fetchone()
        return result[0] if result else None

df_['legal_entity_id'] = df_.apply(lambda row: get_legal_entity_id(row['name'], row['bin']), axis=1)
df_['ownership_form_id'] = df_['ownership_form_name'].apply(lambda x: get_id('ownership_forms', x))
df_['region_id'] = df_['region_name'].apply(lambda x: get_id('regions', x))
df_['provider_help_subtype_id'] = df_['provider_help_subtype_name'].apply(lambda x: get_id('provider_help_subtypes', x))
df_['coexecutor_help_subtype_id'] = df_['coexecutor_help_subtype_name'].apply(lambda x: get_id('coexecutor_help_subtypes', x))
df_['entity_status_id'] = df_['entity_status_name'].apply(lambda x: get_id('healthcare_entity_statuses', x))

columns_needed = ['legal_entity_id', 'is_long_term_contract', 'ownership_form_id', 'region_id',
                  'date_inclusion', 'date_exclusion', 'date_change',
                  'provider_help_subtype_id', 'coexecutor_help_subtype_id',
                  'entity_status_id', 'is_db_included']

df_final = df_[columns_needed]
df_final.to_sql('healthcare_details', engine, if_exists='append', index=False)

print("Таблица healthcare_details успешно заполнена!")

Таблица healthcare_details успешно заполнена!


In [11]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_объявлений.csv"
df = pd.read_csv(file_path)

unique_methods = pd.DataFrame(df['Способ закупки'].dropna().unique(), columns=['name'])
unique_methods.to_sql('purchase_methods', engine, if_exists='append', index=False)

print("Таблица purchase_methods успешно заполнена!")

Таблица purchase_methods успешно заполнена!


In [12]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_объявлений.csv"
df = pd.read_csv(file_path)

unique_item_types = pd.DataFrame(df['Вид предмета закупки'].dropna().unique(), columns=['name'])
unique_item_types.to_sql('item_types', engine, if_exists='append', index=False)

print("Таблица item_types успешно заполнена!")

Таблица item_types успешно заполнена!


In [13]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_объявлений.csv"
df = pd.read_csv(file_path)

unique_procurement_statuses = pd.DataFrame(df['Статус'].dropna().unique(), columns=['name'])
unique_procurement_statuses.to_sql('procurement_statuses', engine, if_exists='append', index=False)

print("Таблица procurement_statuses успешно заполнена!")

Таблица procurement_statuses успешно заполнена!


In [14]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_объявлений.csv"
df = pd.read_csv(file_path)

df_org = df[['Организатор']].dropna().drop_duplicates()
df_org.columns = ['name']
df_org['bin'] = None
df_org['organization_type'] = 'Организатор'
df_org.reset_index(drop=True, inplace=True)

with engine.connect() as conn:
    existing_df = pd.read_sql("SELECT id, name FROM legal_entities", conn)

existing_names = existing_df['name'].tolist()
df_org = df_org[~df_org['name'].isin(existing_names)]

if not existing_df.empty:
    start_id = existing_df['id'].max() + 1
else:
    start_id = 1

df_org.insert(0, 'id', range(start_id, start_id + len(df_org)))
df_org.to_sql('legal_entities', engine, if_exists='append', index=False)

print("Таблица legal_entities (организатор) успешно заполнена!")

Таблица legal_entities (организатор) успешно заполнена!


In [15]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_объявлений.csv"
df = pd.read_csv(file_path)

df_organizers = df[['Организатор']].dropna().drop_duplicates()
df_organizers.columns = ['name']

with engine.connect() as conn:
    legal_ids = pd.read_sql("SELECT id, name FROM legal_entities WHERE organization_type = 'Организатор'", conn)

df_organizers = df_organizers.merge(legal_ids, on='name', how='left')
df_organizers = df_organizers[['id']].rename(columns={'id': 'legal_entity_id'})

df_organizers.to_sql('organizers', engine, if_exists='append', index=False)

print("Таблица organizers успешно заполнена!")

Таблица organizers успешно заполнена!


In [16]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_объявлений.csv"
df = pd.read_csv(file_path)

df = df.rename(columns={
    'Организатор': 'organizer_name',
    'Название объявления': 'name',
    'Способ закупки': 'purchase_method_name',
    'Вид предмета закупки': 'item_type_name',
    'Дата начала приема заявок': 'application_start',
    'Дата окончания приема заявок': 'application_end',
    'Кол-во лотов': 'lot_count',
    'Сумма объявления': 'total_sum',
    'Статус': 'procurement_status_name'
})

if 'organizer_id' in df.columns:
    df = df.drop(columns=['organizer_id'])

def get_id_from_name(table, name):
    if pd.isna(name):
        return None
    with engine.connect() as conn:
        result = conn.execute(text(f"SELECT id FROM {table} WHERE name = :name"), {"name": name}).fetchone()
        return result[0] if result else None

with engine.connect() as conn:
    organizers_df = pd.read_sql("SELECT o.id as organizer_id, le.name as organizer_name FROM organizers o JOIN legal_entities le ON o.legal_entity_id = le.id", conn)

df = df.merge(organizers_df, on='organizer_name', how='left')
df['purchase_method_id'] = df['purchase_method_name'].apply(lambda x: get_id_from_name('purchase_methods', x))
df['item_type_id'] = df['item_type_name'].apply(lambda x: get_id_from_name('item_types', x))
df['status_id'] = df['procurement_status_name'].apply(lambda x: get_id_from_name('procurement_statuses', x))

df_announcements = df[['organizer_id', 'name', 'purchase_method_id', 'item_type_id',
                       'application_start', 'application_end', 'lot_count', 'total_sum', 'status_id']].copy()
df_announcements['application_start'] = pd.to_datetime(df_announcements['application_start'], errors='coerce')
df_announcements['application_end'] = pd.to_datetime(df_announcements['application_end'], errors='coerce')
df_announcements['total_sum'] = df_announcements['total_sum'].astype(str).str.replace(' ', '').str.replace(',', '.').astype(float)
df_announcements.to_sql('announcements', engine, if_exists='append', index=False)

print("Таблица announcements успешно заполнена!")

Таблица announcements успешно заполнена!


In [17]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_лотов.csv"
df = pd.read_csv(file_path)

df_customers = df[['Заказчик']].dropna().drop_duplicates()
df_customers.columns = ['name']
df_customers['bin'] = None
df_customers['organization_type'] = 'Заказчик'

df_customers.reset_index(drop=True, inplace=True)

with engine.connect() as conn:
    max_id = pd.read_sql("SELECT MAX(id) FROM legal_entities", conn).iloc[0, 0]

if max_id is None:
    max_id = 0

with engine.connect() as conn:
    existing_names = pd.read_sql("SELECT name FROM legal_entities WHERE organization_type = 'Заказчик'", conn)['name'].tolist()

df_customers = df_customers[~df_customers['name'].isin(existing_names)]

df_customers['id'] = range(max_id + 1, max_id + len(df_customers) + 1)

if not df_customers.empty:
    df_customers.to_sql('legal_entities', engine, if_exists='append', index=False)
    print("Таблица legal_entities (заказчик) успешно заполнена!")
else:
    print("Нет новых заказчиков для добавления.")

Таблица legal_entities (заказчик) успешно заполнена!


In [18]:
file_path = r"C:\Users\Айгерим\Downloads\поиск_лотов.csv"
df = pd.read_csv(file_path)

df_customers = df[['Заказчик']].dropna().drop_duplicates()
df_customers.columns = ['name']
df_customers.reset_index(drop=True, inplace=True)

insert_data = []

with engine.connect() as conn:
    for name in df_customers['name']:
        result = conn.execute(text("""
            SELECT id FROM legal_entities 
            WHERE name = :name AND organization_type = 'Заказчик'
        """), {"name": name}).fetchone()

        if result:
            legal_entity_id = result[0]
            is_in_customers = conn.execute(text("""
                SELECT 1 FROM customers WHERE legal_entity_id = :id
            """), {"id": legal_entity_id}).fetchone()

            if not is_in_customers:
                insert_data.append({"legal_entity_id": legal_entity_id})

if insert_data:
    df_insert = pd.DataFrame(insert_data)
    df_insert.to_sql('customers', engine, if_exists='append', index=False)
    print("Таблица customers успешно заполнена!")
else:
    print("Новых заказчиков для вставки не найдено.")

Таблица customers успешно заполнена!


In [19]:
file_path_lots = r"C:\Users\Айгерим\Downloads\поиск_лотов.csv"
df_lots = pd.read_csv(file_path_lots)

new_statuses = pd.DataFrame(df_lots['Статус'].dropna().unique(), columns=['name'])

with engine.connect() as conn:
    existing_statuses = pd.read_sql("SELECT name FROM procurement_statuses", conn)['name'].tolist()

new_statuses = new_statuses[~new_statuses['name'].isin(existing_statuses)]

if not new_statuses.empty:
    new_statuses.to_sql('procurement_statuses', engine, if_exists='append', index=False)
    print("Таблица procurement_statuses дополнена новыми статусами из поиска лотов.")
else:
    print("Новых статусов из поиска лотов не найдено.")

Таблица procurement_statuses дополнена новыми статусами из поиска лотов.


In [21]:
engine = create_engine('postgresql://postgres:123@localhost:5432/medical_db?client_encoding=utf8')
df = pd.read_csv(r"C:\Users\Айгерим\Downloads\поиск_лотов.csv", sep=',', encoding='utf-8-sig')

df.columns = df.columns.str.strip()
col_name = [col for col in df.columns if 'Наименование объявления' in col][0]

def extract_until_date(text):
    idx = text.find('Дата начала приема заявок')
    return text[:idx].strip() if idx != -1 else text.strip()

df['clean_lot_name'] = df[col_name].apply(extract_until_date).str.lower()
df['word_count'] = df['clean_lot_name'].apply(lambda x: len(str(x).split()))

with engine.connect() as conn:
    df_ann = pd.read_sql("SELECT id AS announcement_id, name FROM announcements", conn)

df_ann['name'] = df_ann['name'].str.strip().str.lower()
df_ann['name_split'] = df_ann['name'].str.split()

ann_map = {}
for _, row in df.iterrows():
    n_words = row['word_count']
    for _, ann_row in df_ann.iterrows():
        truncated = ' '.join(ann_row['name_split'][:n_words])
        if truncated == row['clean_lot_name']:
            ann_map[row['clean_lot_name']] = ann_row['announcement_id']
            break

df['announcement_id'] = df['clean_lot_name'].map(ann_map)

def load_dict(table, key_col='id', val_col='name'):
    with engine.connect() as conn:
        return pd.read_sql(f"SELECT {key_col}, {val_col} FROM {table}", conn)

df_entities = load_dict('legal_entities')
df_customers = pd.read_sql("SELECT id, legal_entity_id FROM customers", engine)
df_methods = load_dict('purchase_methods')
df_statuses = load_dict('procurement_statuses')

df = df.merge(df_entities, left_on='Заказчик', right_on='name', how='left').rename(columns={'id': 'legal_entity_id'}).drop(columns=['name'])
df = df.merge(df_customers, on='legal_entity_id', how='left').rename(columns={'id': 'customer_id'})
df = df.merge(df_methods, left_on='Способ закупки', right_on='name', how='left').rename(columns={'id': 'purchase_method_id'}).drop(columns=['name'])
df = df.merge(df_statuses, left_on='Статус', right_on='name', how='left').rename(columns={'id': 'status_id'}).drop(columns=['name'])

df['medicine_name'] = df['Наименование ЛС и ИМН']
df['plan_month'] = df['Планируемый срок закупки (месяц)']
df['unit_quantity'] = df['Кол-во единиц измерения']
df['price'] = pd.to_numeric(df['Цена за единицу (тенге)'], errors='coerce')
df['total_sum'] = pd.to_numeric(df['Сумма'], errors='coerce')
df['application_count'] = pd.to_numeric(df['Кол-во заявок'], errors='coerce')

lots_final = df[[
    'announcement_id',
    'customer_id',
    'medicine_name',
    'purchase_method_id',
    'plan_month',
    'unit_quantity',
    'price',
    'total_sum',
    'status_id',
    'application_count'
]].dropna(subset=[
    'announcement_id', 'customer_id', 'purchase_method_id', 'status_id'
])

lots_final = lots_final.astype({
    'announcement_id': 'int',
    'customer_id': 'int',
    'purchase_method_id': 'int',
    'status_id': 'int'
})

if not lots_final.empty:
    with engine.begin() as conn:
        lots_final.to_sql('lots', con=conn, index=False, if_exists='append')
    print("Таблица lots успешно заполнена!")
else:
    print("Нет данных для загрузки в таблицу lots.")

Таблица lots успешно заполнена!


In [24]:
file_path = r"C:\Users\Айгерим\Downloads\реестр_участников.csv"
df = pd.read_csv(file_path)

df_part = df[['Наименование участника', 'БИН (ИНН, УНП)']].dropna(subset=['Наименование участника']).drop_duplicates()
df_part.columns = ['name', 'bin']
df_part['organization_type'] = 'Участник'
df_part.reset_index(drop=True, inplace=True)

with engine.connect() as conn:
    existing_df = pd.read_sql("SELECT id, name, bin FROM legal_entities", conn)

df_part = df_part[~(
    df_part.set_index(['name', 'bin']).index.isin(
        existing_df.set_index(['name', 'bin']).index
    )
)]

if not existing_df.empty:
    start_id = existing_df['id'].max() + 1
else:
    start_id = 1

df_part.insert(0, 'id', range(start_id, start_id + len(df_part)))
df_part.to_sql('legal_entities', engine, if_exists='append', index=False)

print("Таблица legal_entities (участник) успешно заполнена!")

Таблица legal_entities (участник) успешно заполнена!


In [25]:
engine = create_engine('postgresql://postgres:123@localhost:5432/medical_db?client_encoding=utf8')

with engine.connect() as conn:
    df_legal = pd.read_sql("""
        SELECT id
        FROM legal_entities
        WHERE organization_type = 'Участник'
    """, conn)

df_legal = df_legal.drop_duplicates(subset=['id']).copy()
df_legal.rename(columns={'id': 'legal_entity_id'}, inplace=True)

with engine.connect() as conn:
    existing = pd.read_sql("SELECT id FROM participants", conn)

if not existing.empty:
    start_id = existing['id'].max() + 1
else:
    start_id = 1

df_legal.insert(0, 'id', range(start_id, start_id + len(df_legal)))
df_legal.to_sql('participants', engine, if_exists='append', index=False)

print("Таблица participants успешно заполнена!")

Таблица participants успешно заполнена!
