In [1]:
import pandas as pd
from sqlalchemy import text, create_engine, inspect

In [2]:
# Проверим, что сервер PostgreSQL запущен

!systemctl status postgresql

[0;1;32m●[0m postgresql.service - PostgreSQL RDBMS
     Loaded: loaded (]8;;file://acer-wsl/lib/systemd/system/postgresql.service/lib/systemd/system/postgresql.service]8;;; enabled; vendor preset: enabled)
     Active: [0;1;32mactive (exited)[0m since Tue 2025-11-18 13:00:47 MSK; 4h 14min ago
    Process: 338 ExecStart=/bin/true (code=exited, status=0/SUCCESS)
   Main PID: 338 (code=exited, status=0/SUCCESS)
        CPU: 1ms

Nov 18 13:00:47 acer-wsl systemd[1]: Starting PostgreSQL RDBMS...
Nov 18 13:00:47 acer-wsl systemd[1]: Finished PostgreSQL RDBMS.


In [3]:
# Создаем подключение к БД PostgreSQL

with open('./password.txt', encoding='UTF-8') as f:
    password = f.readline()

try:
    engine = create_engine(
        f"postgresql://postgres:{password}@localhost:5432/postgres"
    )
    conn = engine.connect()
    print('Соединение успешно установлено!')
except:
    print('Ошибка подключения!')

Соединение успешно установлено!


In [4]:
# Проверим, что БД PostgreSQL пуста и не имеет таблиц.
# Для этой и последующих проверок создадим функцию `check_db_tables``

def check_db_tables(engine):
    tables_list = inspect(engine).get_table_names
    if not tables_list():
        print('Таблицы в БД отсутствуют:', tables_list())

    else:
        print('Имеющиеся в БД таблицы:', *tables_list(), sep='\n  >> ')

    return tables_list()

tables = check_db_tables(engine)

Имеющиеся в БД таблицы:
  >> customer
  >> order_items
  >> orders
  >> product


In [5]:
# Удаление всех таблиц в БД

def del_tables(conn, tables):
    conn.commit()
    for table in tables[::]:
        conn.execute(text(f"DROP TABLE IF EXISTS {table} CASCADE;"))
    conn.commit()

del_tables(conn, tables)

#### Шаг 1. Создать таблицы с перечисленными ниже структурами, используя CSV-файлы.

#### Чтение csv таблиц

In [6]:
# Откроем таблицы в Pandas

customer = pd.read_csv('./data-samples/customer.csv',
                       delimiter=';',
                       dtype={'postcode': str})

order_items = pd.read_csv('./data-samples/order_items.csv',
                          delimiter=',',
                          dtype={'quantity': int})

orders = pd.read_csv('./data-samples/orders.csv', delimiter=',')

product = pd.read_csv('./data-samples/product.csv', delimiter=',')

In [7]:
print("customer shape:", customer.shape)
print("order_items shape:", order_items.shape)
print("orders shape:", orders.shape)
print("product shape:", product.shape)

customer shape: (4000, 15)
order_items shape: (20000, 6)
orders shape: (20000, 5)
product shape: (190, 7)


#### Создание таблиц в БД PostreSQL

In [8]:
# Создание таблиц в БД PostgreSQL

create_tables_query = """
    CREATE TABLE IF NOT EXISTS customer (
         customer_id INT4 PRIMARY KEY
        ,first_name VARCHAR(128) NOT NULL
        ,last_name VARCHAR(128)
        ,gender VARCHAR(128) NOT NULL
        ,DOB DATE
        ,job_title VARCHAR(128)
        ,job_industry_category VARCHAR(128)
        ,wealth_segment VARCHAR(128) NOT NULL
        ,deceased_indicator VARCHAR(128) NOT NULL
        ,owns_car VARCHAR(128) NOT NULL
        ,address VARCHAR(128) NOT NULL
        ,postcode VARCHAR(128) NOT NULL
        ,state VARCHAR(128) NOT NULL
        ,country VARCHAR(128) NOT NULL
        ,property_valuation INT2 NOT NULL
    );

    CREATE TABLE IF NOT EXISTS order_items (
         order_item_id INT4 PRIMARY KEY
        ,order_id INT4 NOT NULL
        ,product_id INT4 NOT NULL
        ,quantity INT4 NOT NULL
        ,item_list_price_at_sale FLOAT4 NOT NULL
        ,item_standard_cost_at_sale FLOAT4
    );

    CREATE TABLE IF NOT EXISTS orders (
         order_id INT4 PRIMARY KEY
        ,customer_id INT4 NOT NULL
        ,order_date DATE NOT NULL
        ,online_order BOOLEAN
        ,order_status VARCHAR(128) NOT NULL
    );

    CREATE TABLE IF NOT EXISTS product (
         product_id INT4 NOT NULL
        ,brand VARCHAR(128)
        ,product_line VARCHAR(128)
        ,product_class VARCHAR(128)
        ,product_size VARCHAR(128)
        ,list_price FLOAT4 NOT NULL
        ,standard_cost FLOAT4
    )
"""
conn.execute(text(create_tables_query));

In [9]:
# Фиксация изменений в БД PostgreSQL

conn.commit();

#### Загрузка данных в таблицы БД PostgreSQL

In [10]:
# Запрос на загрузку таблицы `customer`
load_table_customer_query = """

    INSERT INTO customer (
        customer_id, first_name, last_name, gender, DOB, job_title,
        job_industry_category, wealth_segment, deceased_indicator, owns_car,
        address, postcode, state, country, property_valuation

    ) VALUES (:customer_id
             ,:first_name
             ,NULLIF(:last_name, 'NaN')
             ,:gender
             ,CAST(NULLIF(CAST(:DOB AS TEXT), 'NaN') AS DATE)
             ,NULLIF(:job_title, 'NaN')
             ,NULLIF(:job_industry_category, 'NaN')
             ,:wealth_segment
             ,:deceased_indicator
             ,:owns_car
             ,:address
             ,:postcode
             ,:state
             ,:country
             ,:property_valuation)
"""

# Загрузка таблицы `customer`
conn.execute(text(load_table_customer_query),
             customer.to_dict('records'));

In [11]:
# Запрос на загрузку таблицы `order_items`
load_table_order_items_query = """

    INSERT INTO order_items (
        order_item_id, order_id, product_id, quantity, item_list_price_at_sale,
        item_standard_cost_at_sale
    
    ) VALUES (:order_item_id
             ,:order_id
             ,:product_id
             ,:quantity
             ,:item_list_price_at_sale
             ,NULLIF(:item_standard_cost_at_sale, 'NaN'))
"""

# Загрузка таблицы `order_items`
conn.execute(text(load_table_order_items_query),
             order_items.to_dict('records'));

In [12]:
# Запрос на загрузку таблицы `orders`
load_table_orders_query = """

    INSERT INTO orders (
        order_id, customer_id, order_date, online_order, order_status

    ) VALUES (:order_id
             ,:customer_id
             ,CAST(:order_date AS DATE)
             ,CAST(NULLIF(CAST(:online_order AS TEXT), 'NaN') AS BOOLEAN)
             ,:order_status)
"""

# Загрузка таблицы `orders`
conn.execute(text(load_table_orders_query),
             orders.to_dict('records'));

In [13]:
# Запрос на загрузку таблицы `product`
load_table_product_query = """

    INSERT INTO product (
        product_id, brand, product_line, product_class, product_size,
        list_price, standard_cost

    ) VALUES (:product_id
             ,NULLIF(:brand, 'NaN')
             ,NULLIF(:product_line, 'NaN')
             ,NULLIF(:product_class, 'NaN')
             ,NULLIF(:product_size, 'NaN')
             ,:list_price
             ,CAST(NULLIF(CAST(:standard_cost AS TEXT), 'NaN') AS FLOAT4))
"""

# Загрузка таблицы `product`
conn.execute(text(load_table_product_query),
             product.to_dict('records'));

In [14]:
# Фиксация изменений в БД PostgreSQL

conn.commit();

#### Проверка созданных таблиц

In [16]:
tables = check_db_tables(engine)

Имеющиеся в БД таблицы:
  >> product
  >> customer
  >> order_items
  >> orders


<div style="text-align: center;">
  <img src="./misc/images/exists_tables.png" width=720/>
  <p>Визуальная проверка существования таблиц</p>
</div>


#### Загрузка данных в таблицы БД PostgreSQL