In [15]:
import pandas as pd
from clickhouse_driver import Client
import logging
from datetime import datetime, timedelta

# Настройки логирования
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# Настройки подключения к ClickHouse
clickhouse_host = '10.95.19.132'
clickhouse_port = 9000
clickhouse_user = 'default'
clickhouse_password = 'quie1ahpoo5Su0wohpaedae8keeph6bi'
database_name = 'default'
table_name = 'Vygruzka'

# Поля таблицы с Nullable(Date) и другими строковыми полями
columns = [
    ('partno', 'Nullable(String)'),
    ('serialno', 'Nullable(String)'),
    ('ac_typ', 'Nullable(String)'),
    ('ll', 'Nullable(Float64)'),
    ('oh', 'Nullable(Float64)'),
    ('sne', 'Nullable(Float64)'),
    ('ppr', 'Nullable(Float64)'),
    ('shop_visit_counter', 'Nullable(Float64)'),
    ('owner', 'Nullable(String)'),
    ('condition', 'Nullable(String)'),
    ('mfg_date', 'Nullable(Date)'),
    ('oh_at_date', 'Nullable(Date)'),
    ('removal_date', 'Nullable(Date)'),
    ('repair_date', 'Nullable(Date)')
]

# Функция для создания таблицы

def create_multidimensional_olap_cube(client):
    # Получение уникальных значений serialno из таблицы Vygruzka
    serialnos = client.execute(f"""
        SELECT DISTINCT serialno FROM {database_name}.{table_name}
        WHERE serialno IS NOT NULL
        AND ll IS NOT NULL
        AND sne <= ll
        AND BR != 0
        AND NOT (sne > BR AND condition = 'НЕИСПРАВНЫЙ')
    """)
    serialnos = [row[0] for row in serialnos]
    logging.info(f"Количество загруженных агрегатов: {len(serialnos)}")

    # Получение начальной даты из таблицы Vygruzka
    unload_date = client.execute(f"SELECT MIN(UnloadDate) FROM {database_name}.Agregat WHERE UnloadDate IS NOT NULL")[0][0]
    logging.info(f"Начальная дата: {unload_date}")
    if unload_date is None:
        raise ValueError("Не удалось получить начальную дату из таблицы Agregat")

    # Создание диапазона дат +4000 дней начиная с unload_date
    date_range = [unload_date + timedelta(days=i) for i in range(4001)]

    # Подготовка данных для вставки в OLAP куб
    olap_data = []
    for serialno in serialnos:
        for date in date_range:
            olap_data.append({
                'SN': serialno,
                'Dates': date,
                'Status_P': None,  # Расчетное поле, значение будет заполнено алгоритмом
                'SNE': None,       # Наработка с начала эксплуатации, значение будет заполнено алгоритмом
                'PPR': None,       # Наработка после последнего ремонта, значение будет заполнено алгоритмом
                'Repair': None,    # Показатель ремонта, значение будет заполнено алгоритмом
                'Status': None     # Текущий статус, значение будет заполнено алгоритмом
            })

    # Создание таблицы для OLAP куба
    olap_table_name = 'OlapCube'
    client.execute(f"DROP TABLE IF EXISTS {database_name}.{olap_table_name}")
    create_olap_query = f"""
    CREATE TABLE IF NOT EXISTS {database_name}.{olap_table_name} (
        SN String,
        Dates Date,
        Status_P Nullable(String),
        SNE Nullable(Float64),
        PPR Nullable(Float64),
        Repair Nullable(String),
        Status Nullable(String)
    ) ENGINE = MergeTree()
    ORDER BY (SN, Dates)
    """
    client.execute(create_olap_query)

    # Вставка данных в OLAP куб
    client.execute(f"INSERT INTO {database_name}.{olap_table_name} VALUES", olap_data)

# Подключение к ClickHouse
client = Client(host=clickhouse_host, port=clickhouse_port, user=clickhouse_user, password=clickhouse_password)

# Создание многомерного OLAP куба
try:
    create_multidimensional_olap_cube(client)
    logging.info("Многомерный OLAP куб успешно создан и данные загружены")
except Exception as e:
    logging.error(f"Произошла ошибка: {e}", exc_info=True)


2024-11-22 20:04:34,260 - INFO - Количество загруженных агрегатов: 270
2024-11-22 20:04:34,266 - INFO - Начальная дата: 2024-11-22
2024-11-22 20:04:41,796 - INFO - Многомерный OLAP куб успешно создан и данные загружены


In [16]:
import pandas as pd
from clickhouse_driver import Client
import logging
from datetime import datetime, timedelta

# Настройки логирования
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# Настройки подключения к ClickHouse
clickhouse_host = '10.95.19.132'
clickhouse_port = 9000
clickhouse_user = 'default'
clickhouse_password = 'quie1ahpoo5Su0wohpaedae8keeph6bi'
database_name = 'default'
table_name = 'Vygruzka'

# Поля таблицы с Nullable(Date) и другими строковыми полями
columns = [
    ('partno', 'Nullable(String)'),
    ('serialno', 'Nullable(String)'),
    ('ac_typ', 'Nullable(String)'),
    ('ll', 'Nullable(Float64)'),
    ('oh', 'Nullable(Float64)'),
    ('sne', 'Nullable(Float64)'),
    ('ppr', 'Nullable(Float64)'),
    ('shop_visit_counter', 'Nullable(Float64)'),
    ('owner', 'Nullable(String)'),
    ('condition', 'Nullable(String)'),
    ('mfg_date', 'Nullable(Date)'),
    ('oh_at_date', 'Nullable(Date)'),
    ('removal_date', 'Nullable(Date)'),
    ('repair_date', 'Nullable(Date)')
]

# Функция для создания таблицы

def create_multidimensional_olap_cube(client):
    # Получение уникальных значений serialno из таблицы Vygruzka
    serialnos = client.execute(f"""
        SELECT DISTINCT serialno FROM {database_name}.{table_name}
        WHERE serialno IS NOT NULL
        AND ll IS NOT NULL
        AND sne <= ll
        AND BR != 0
        AND NOT (sne > BR AND condition = 'НЕИСПРАВНЫЙ')
            """)
    serialnos = [row[0] for row in serialnos]
    logging.info(f"Количество загруженных агрегатов: {len(serialnos)}")

    # Получение начальной даты из таблицы Vygruzka
    unload_date = client.execute(f"SELECT MIN(UnloadDate) FROM {database_name}.Agregat WHERE UnloadDate IS NOT NULL")[0][0]
    logging.info(f"Начальная дата: {unload_date}")
    if unload_date is None:
        raise ValueError("Не удалось получить начальную дату из таблицы Agregat")

    # Создание диапазона дат +4000 дней начиная с unload_date
    date_range = [unload_date + timedelta(days=i) for i in range(4001)]

    # Подготовка данных для вставки в OLAP куб
    olap_data = []
    for serialno in serialnos:
        for date in date_range:
            olap_data.append({
                'SN': serialno,
                'Dates': date,
                'Status_P': None,  # Расчетное поле, значение будет заполнено алгоритмом
                'SNE': None,       # Наработка с начала эксплуатации, значение будет заполнено алгоритмом
                'PPR': None,       # Наработка после последнего ремонта, значение будет заполнено алгоритмом
                'Repair': None,    # Показатель ремонта, значение будет заполнено алгоритмом
                'Status': None     # Текущий статус, значение будет заполнено алгоритмом
            })

    # Создание таблицы для OLAP куба
    olap_table_name = 'OlapCube'
    client.execute(f"DROP TABLE IF EXISTS {database_name}.{olap_table_name}")
    create_olap_query = f"""
    CREATE TABLE IF NOT EXISTS {database_name}.{olap_table_name} (
        SN String,
        Dates Date,
        Status_P Nullable(String),
        SNE Nullable(Float64),
        PPR Nullable(Float64),
        Repair Nullable(String),
        Status Nullable(String)
    ) ENGINE = MergeTree()
    ORDER BY (SN, Dates)
    """
    client.execute(create_olap_query)

    # Вставка данных в OLAP куб
    client.execute(f"INSERT INTO {database_name}.{olap_table_name} VALUES", olap_data)

# Подключение к ClickHouse
client = Client(host=clickhouse_host, port=clickhouse_port, user=clickhouse_user, password=clickhouse_password)

# Создание многомерного OLAP куба
try:
    create_multidimensional_olap_cube(client)
    logging.info("Многомерный OLAP куб успешно создан и данные загружены")
except Exception as e:
    logging.error(f"Произошла ошибка: {e}", exc_info=True)


2024-11-22 20:12:18,921 - INFO - Количество загруженных агрегатов: 270
2024-11-22 20:12:18,928 - INFO - Начальная дата: 2024-11-22
2024-11-22 20:12:26,734 - INFO - Многомерный OLAP куб успешно создан и данные загружены
