In [9]:
import pandas as pd


def read_columns_from_excel(file_path):
    """
    Читает и выводит столбцы для каждого листа в файле Excel.
    """
    try:
        # Чтение всех листов из файла Excel
        df_dict = pd.read_excel(file_path, sheet_name=None, dtype=str, engine='openpyxl')

        for sheet_name, df in df_dict.items():
            print(f"Лист: {sheet_name}")
            print(f"Столбцы: {list(df.columns)}\n")

    except Exception as e:
        print(f"Ошибка при чтении столбцов из файла: {file_path} - {e}")


# Пример использования
file_path = '/Users/dauren/Desktop/02.09.2024 OK/210740009061 ЭСФ реализация за апр-июль 2024.xlsx'
read_columns_from_excel(file_path)


In [10]:
import pandas as pd


def read_and_rename_columns(file_path, column_mapping):
    """
    Читает и переименовывает столбцы для каждого листа в файле Excel по указанному сопоставлению.
    """
    try:
        # Чтение всех листов из файла Excel
        df_dict = pd.read_excel(file_path, sheet_name=None, dtype=str, engine='openpyxl')

        for sheet_name, df in df_dict.items():
            print(f"Лист: {sheet_name}")
            original_columns = list(df.columns)
            print(f"Исходные столбцы: {original_columns}")

            # Переименование столбцов согласно словарю
            renamed_columns = {col: column_mapping.get(col, col) for col in df.columns}
            df.rename(columns=renamed_columns, inplace=True)
            print(f"Переименованные столбцы: {list(df.columns)}\n")

    except Exception as e:
        print(f"Ошибка при чтении и переименовании столбцов из файла: {file_path} - {e}")


# Словарь для переименования столбцов
column_mapping = {
    'Регистрационный номер ЭСФ (29/08/2024)': 'ESF_Registration_Number',
    'Код органа государственных доходов': 'Tax_Authority_Code',
    'Вид счет-фактуры': 'Invoice_Type',
    'Статус ЭСФ': 'ESF_Status',
    'Статус ЭСФ после отправки получателю': 'ESF_Status_After_Sending',
    'Дата выписки': 'Issue_Date',
    'Дата выписки на бумажном носителе': 'Paper_Issue_Date',
    'Дата совершения оборота': 'Transaction_Date',
    'Ф.И.О., лица выписавшего ЭСФ': 'Issuer_Full_Name',
    'Номер учетной системы': 'System_Number',
    'Дата обновления СФ': 'Invoice_Update_Date',
    'ИИН/БИН': 'IIN_BIN',
    'Наименование поставщика по данным ИНИС на рус.': 'Supplier_Name_INIS',
    'Наименование поставщика по данным ИС ЭСФ': 'Supplier_Name_ESF',
    'Адрес места нахождения': 'Location_Address',
    'Номер свидетельства плательщика НДС': 'VAT_Certificate_Number',
    'Серия свидетельства плательщика НДС': 'VAT_Certificate_Series',
    'Номер документа, подтверждающего поставку ТРУ': 'Supply_Confirm_Document_Number',
    'Дата документа, подтверждающего поставку ТРУ': 'Supply_Confirm_Document_Date',
    'Дополнительные сведения': 'Additional_Information',
    'КБЕ': 'KBE',
    'ИИК': 'IBAN',
    'БИК': 'BIC',
    'Наименование банка': 'Bank_Name',
    'Доля участия': 'Participation_Share',
    'Дата выписки (поставщики)': 'Supplier_Issue_Date',
    'Категория поставщика': 'Supplier_Category',
    'Наименование получателя по данным ИС ЭСФ': 'Receiver_Name_ESF',
    'Наименование получателя по данным ИНИС на рус.': 'Receiver_Name_INIS',
    'ИИН/БИН.1': 'IIN_BIN_1',
    'Адрес места нахождения.1': 'Location_Address_1',
    'Дополнительные сведения.1': 'Additional_Information_1',
    'Код страны': 'Country_Code',
    'Доля участия.1': 'Participation_Share_1',
    'Дата выписки (получатели)': 'Receiver_Issue_Date',
    'Категория получателя': 'Receiver_Category',
    'ИИН/БИН.2': 'IIN_BIN_2',
    'Наименование': 'Name',
    'Адрес отправки': 'Shipping_Address',
    'ИИН/БИН.3': 'IIN_BIN_3',
    'Наименование грузополучателя': 'Consignee_Name',
    'Адрес доставки': 'Delivery_Address',
    'Код страны.1': 'Country_Code_1',
    'Номер договора (контракта) на поставку ТРУ': 'Supply_Contract_Number',
    'Дата договора (контракта) на поставку ТРУ': 'Supply_Contract_Date',
    'Условия оплаты по договору': 'Payment_Terms',
    'Способ отправления': 'Shipping_Method',
    'Номер доверенности на поставку ТРУ': 'Supply_Power_of_Attorney_Number',
    'Дата доверенности на поставку ТРУ': 'Supply_Power_of_Attorney_Date',
    'Пункт назначения': 'Destination_Point',
    'Наличие договора': 'Contract_Availability',
    'ИИК.1': 'IBAN_1',
    'Код ТРУ': 'TRU_Code',
    'Назначение платежа': 'Payment_Purpose',
    'БИК.1': 'BIC_1',
    'Порядковый номер ТРУ': 'TRU_Sequence_Number',
    'Признак происхождения товара, работ, услуг': 'Goods_Origin',
    'Наименование ТРУ': 'TRU_Name',
    'Наименование товаров в соответствии с Декларацией на товары или заявления о ввозе товаров и уплате косвенных налогов': 'Goods_Name_Declaration',
    'Код товара (ТН ВЭД)': 'Commodity_Code',
    'Единица измерения': 'Unit_of_Measurement',
    'Кол-во (объем)': 'Quantity',
    'Цена (тариф) за единицу ТРУ без косвенных налогов': 'Price_per_Unit_Excluding_Taxes',
    'Стоимость товаров, работ, услуг без учета косвенных налогов': 'Cost_Excluding_Taxes',
    'Ставка акциза': 'Excise_Rate',
    'Сумма акциза': 'Excise_Amount',
    'Размер оборота по реализации': 'Turnover_Size',
    'Ставка НДС': 'VAT_Rate',
    'Сумма НДС': 'VAT_Amount',
    'Стоимость товаров, работ, услуг с учетом косвенных налогов': 'Cost_Including_Taxes',
    'Номер декларации на товары, заявления в рамках ТС, СТ-1 или СТ-KZ': 'Declaration_Number',
    'Номер товарной позиции из заявления о ввозе товаров и уплате косвенных налогов или Декларации на товары': 'Item_Position_Number',
    'Дополнительные данные': 'Additional_Data',
    'Курс валюты': 'Currency_Rate',
    'Код валюты': 'Currency_Code',
    'Наименование валюты на рус.': 'Currency_Name',
    'Всего по счету, стоимость товаров, работ, услуг без учета косвенных налогов': 'Total_Cost_Excluding_Taxes',
    'Всего по счету, размер оборота по реализации': 'Total_Turnover_Size',
    'Всего по счету, сумма НДС': 'Total_VAT_Amount',
    'Всего по счету, стоимость товаров, работ, услуг с учетом косвенных налогов': 'Total_Cost_Including_Taxes',
    'ИИН/БИН участника совместной деятельности': 'Joint_Activity_Participant_IIN_BIN',
    'Номер продукта (товара, услуги)': 'Product_Number',
    'Количество (объём)': 'Quantity_Volume',
    'Сумма НДС.1': 'VAT_Amount_1',
    'Стоимость ТРУ с учетом НДС': 'Cost_Including_VAT',
    'Стоимость ТРУ без учета НДС': 'Cost_Excluding_VAT',
    'Размер оборота по реализации.1': 'Turnover_Size_1',
    'Регистрационный номер': 'Registration_Number',
    'Дата выписки СФ, к которому выписывается исправленный/дополнительный СФ': 'Corrected_Invoice_Date'
}

# Пример использования
file_path = '/Users/dauren/Desktop/02.09.2024 OK/210740009061 ЭСФ реализация за апр-июль 2024.xlsx'
read_and_rename_columns(file_path, column_mapping)


Лист: ЭСФ апр-июль 2024
Исходные столбцы: ['Регистрационный номер ЭСФ (29/08/2024)', 'Код органа государственных доходов', 'Вид счет-фактуры', 'Статус ЭСФ', 'Статус ЭСФ после отправки получателю', 'Дата выписки', 'Дата выписки на бумажном носителе', 'Дата совершения оборота', 'Ф.И.О., лица выписавшего ЭСФ', 'Номер учетной системы', 'Дата обновления СФ', 'ИИН/БИН', 'Наименование поставщика по данным ИНИС на рус.', 'Наименование поставщика по данным ИС ЭСФ', 'Адрес места нахождения', 'Номер свидетельства плательщика НДС', 'Серия свидетельства плательщика НДС', 'Номер документа, подтверждающего поставку ТРУ', 'Дата документа, подтверждающего поставку ТРУ', 'Дополнительные сведения', 'КБЕ', 'ИИК', 'БИК', 'Наименование банка', 'Доля участия', 'Дата выписки (поставщики)', 'Категория поставщика', 'Наименование получателя по данным ИС ЭСФ', 'Наименование получателя по данным ИНИС на рус.', 'ИИН/БИН.1', 'Адрес места нахождения.1', 'Дополнительные сведения.1', 'Код страны', 'Доля участия.1', 'Да

In [11]:
import pandas as pd


def read_rename_and_display_data(file_path, column_mapping):
    """
    Читает, переименовывает столбцы и выводит данные для каждого листа в файле Excel по указанному сопоставлению.
    """
    try:
        # Чтение всех листов из файла Excel
        df_dict = pd.read_excel(file_path, sheet_name=None, dtype=str, engine='openpyxl')

        for sheet_name, df in df_dict.items():
            print(f"Лист: {sheet_name}\n")
            print("Исходные столбцы и данные:")
            for col in df.columns:
                print(f"[{col}]: {df[col].tolist()}")

            # Переименование столбцов согласно словарю
            renamed_columns = {col: column_mapping.get(col, col) for col in df.columns}
            df.rename(columns=renamed_columns, inplace=True)
            print("\nПереименованные столбцы и данные:")
            for col in df.columns:
                print(f"[{col}]: {df[col].tolist()}")
            print("\n" + "=" * 70 + "\n")

    except Exception as e:
        print(f"Ошибка при чтении и переименовании столбцов из файла: {file_path} - {e}")


# Словарь для переименования столбцов
column_mapping = {
    'Регистрационный номер ЭСФ (29/08/2024)': 'ESF_Registration_Number',
    'Код органа государственных доходов': 'Tax_Authority_Code',
    'Вид счет-фактуры': 'Invoice_Type',
    'Статус ЭСФ': 'ESF_Status',
    'Статус ЭСФ после отправки получателю': 'ESF_Status_After_Sending',
    'Дата выписки': 'Issue_Date',
    'Дата выписки на бумажном носителе': 'Paper_Issue_Date',
    'Дата совершения оборота': 'Transaction_Date',
    'Ф.И.О., лица выписавшего ЭСФ': 'Issuer_Full_Name',
    'Номер учетной системы': 'System_Number',
    'Дата обновления СФ': 'Invoice_Update_Date',
    'ИИН/БИН': 'IIN_BIN',
    'Наименование поставщика по данным ИНИС на рус.': 'Supplier_Name_INIS',
    'Наименование поставщика по данным ИС ЭСФ': 'Supplier_Name_ESF',
    'Адрес места нахождения': 'Location_Address',
    'Номер свидетельства плательщика НДС': 'VAT_Certificate_Number',
    'Серия свидетельства плательщика НДС': 'VAT_Certificate_Series',
    'Номер документа, подтверждающего поставку ТРУ': 'Supply_Confirm_Document_Number',
    'Дата документа, подтверждающего поставку ТРУ': 'Supply_Confirm_Document_Date',
    'Дополнительные сведения': 'Additional_Information',
    'КБЕ': 'KBE',
    'ИИК': 'IBAN',
    'БИК': 'BIC',
    'Наименование банка': 'Bank_Name',
    'Доля участия': 'Participation_Share',
    'Дата выписки (поставщики)': 'Supplier_Issue_Date',
    'Категория поставщика': 'Supplier_Category',
    'Наименование получателя по данным ИС ЭСФ': 'Receiver_Name_ESF',
    'Наименование получателя по данным ИНИС на рус.': 'Receiver_Name_INIS',
    'ИИН/БИН.1': 'IIN_BIN_1',
    'Адрес места нахождения.1': 'Location_Address_1',
    'Дополнительные сведения.1': 'Additional_Information_1',
    'Код страны': 'Country_Code',
    'Доля участия.1': 'Participation_Share_1',
    'Дата выписки (получатели)': 'Receiver_Issue_Date',
    'Категория получателя': 'Receiver_Category',
    'ИИН/БИН.2': 'IIN_BIN_2',
    'Наименование': 'Name',
    'Адрес отправки': 'Shipping_Address',
    'ИИН/БИН.3': 'IIN_BIN_3',
    'Наименование грузополучателя': 'Consignee_Name',
    'Адрес доставки': 'Delivery_Address',
    'Код страны.1': 'Country_Code_1',
    'Номер договора (контракта) на поставку ТРУ': 'Supply_Contract_Number',
    'Дата договора (контракта) на поставку ТРУ': 'Supply_Contract_Date',
    'Условия оплаты по договору': 'Payment_Terms',
    'Способ отправления': 'Shipping_Method',
    'Номер доверенности на поставку ТРУ': 'Supply_Power_of_Attorney_Number',
    'Дата доверенности на поставку ТРУ': 'Supply_Power_of_Attorney_Date',
    'Пункт назначения': 'Destination_Point',
    'Наличие договора': 'Contract_Availability',
    'ИИК.1': 'IBAN_1',
    'Код ТРУ': 'TRU_Code',
    'Назначение платежа': 'Payment_Purpose',
    'БИК.1': 'BIC_1',
    'Порядковый номер ТРУ': 'TRU_Sequence_Number',
    'Признак происхождения товара, работ, услуг': 'Goods_Origin',
    'Наименование ТРУ': 'TRU_Name',
    'Наименование товаров в соответствии с Декларацией на товары или заявления о ввозе товаров и уплате косвенных налогов': 'Goods_Name_Declaration',
    'Код товара (ТН ВЭД)': 'Commodity_Code',
    'Единица измерения': 'Unit_of_Measurement',
    'Кол-во (объем)': 'Quantity',
    'Цена (тариф) за единицу ТРУ без косвенных налогов': 'Price_per_Unit_Excluding_Taxes',
    'Стоимость товаров, работ, услуг без учета косвенных налогов': 'Cost_Excluding_Taxes',
    'Ставка акциза': 'Excise_Rate',
    'Сумма акциза': 'Excise_Amount',
    'Размер оборота по реализации': 'Turnover_Size',
    'Ставка НДС': 'VAT_Rate',
    'Сумма НДС': 'VAT_Amount',
    'Стоимость товаров, работ, услуг с учетом косвенных налогов': 'Cost_Including_Taxes',
    'Номер декларации на товары, заявления в рамках ТС, СТ-1 или СТ-KZ': 'Declaration_Number',
    'Номер товарной позиции из заявления о ввозе товаров и уплате косвенных налогов или Декларации на товары': 'Item_Position_Number',
    'Дополнительные данные': 'Additional_Data',
    'Курс валюты': 'Currency_Rate',
    'Код валюты': 'Currency_Code',
    'Наименование валюты на рус.': 'Currency_Name',
    'Всего по счету, стоимость товаров, работ, услуг без учета косвенных налогов': 'Total_Cost_Excluding_Taxes',
    'Всего по счету, размер оборота по реализации': 'Total_Turnover_Size',
    'Всего по счету, сумма НДС': 'Total_VAT_Amount',
    'Всего по счету, стоимость товаров, работ, услуг с учетом косвенных налогов': 'Total_Cost_Including_Taxes',
    'ИИН/БИН участника совместной деятельности': 'Joint_Activity_Participant_IIN_BIN',
    'Номер продукта (товара, услуги)': 'Product_Number',
    'Количество (объём)': 'Quantity_Volume',
    'Сумма НДС.1': 'VAT_Amount_1',
    'Стоимость ТРУ с учетом НДС': 'Cost_Including_VAT',
    'Стоимость ТРУ без учета НДС': 'Cost_Excluding_VAT',
    'Размер оборота по реализации.1': 'Turnover_Size_1',
    'Регистрационный номер': 'Registration_Number',
    'Дата выписки СФ, к которому выписывается исправленный/дополнительный СФ': 'Corrected_Invoice_Date'
}

# Пример использования
file_path = '/Users/dauren/Desktop/02.09.2024 OK/210740009061 ЭСФ реализация за апр-июль 2024.xlsx'
read_rename_and_display_data(file_path, column_mapping)

Лист: ЭСФ апр-июль 2024

Исходные столбцы и данные:
[Регистрационный номер ЭСФ (29/08/2024)]: ['ESF-210740009061-20240401-51787563', 'ESF-210740009061-20240409-71070713', 'ESF-210740009061-20240411-77233843', 'ESF-210740009061-20240415-57435771', 'ESF-210740009061-20240418-63171701', 'ESF-210740009061-20240418-72067752', 'ESF-210740009061-20240418-72067752', 'ESF-210740009061-20240423-79047512', 'ESF-210740009061-20240423-79047512', 'ESF-210740009061-20240423-79047512', 'ESF-210740009061-20240423-79047512', 'ESF-210740009061-20240423-79060892', 'ESF-210740009061-20240424-01371263', 'ESF-210740009061-20240424-01371263', 'ESF-210740009061-20240424-81809722', 'ESF-210740009061-20240424-81809722', 'ESF-210740009061-20240424-81809722', 'ESF-210740009061-20240424-81809722', 'ESF-210740009061-20240426-79394601', 'ESF-210740009061-20240426-79394601', 'ESF-210740009061-20240426-79824741', 'ESF-210740009061-20240426-79824741', 'ESF-210740009061-20240426-79824741', 'ESF-210740009061-20240426-8632

Code Actual don't link to referenece

In [1]:
import os
import re
import pandas as pd
from sqlalchemy import create_engine, MetaData, Table, text
from datetime import datetime
import urllib


def normalize_column_names(df, column_mapping):
    print("Нормализация имен столбцов...")
    for old_name in df.columns:
        new_name = column_mapping.get(old_name, None)
        if new_name is None:
            for pattern in column_mapping.keys():
                if re.match(pattern, old_name):
                    new_name = column_mapping[pattern]
                    break
        if new_name:
            df.rename(columns={old_name: new_name}, inplace=True)


def read_and_rename_columns_from_file(file_path, column_mapping, dtype_mapping):
    df_list = []
    try:
        print(f"Чтение файла {file_path} и переименование столбцов...")
        df_dict = pd.read_excel(file_path, sheet_name=None, dtype=str, engine='openpyxl')
        for sheet_name, df in df_dict.items():
            normalize_column_names(df, column_mapping)
            for col in df.columns:
                if col in dtype_mapping:
                    df[col] = df[col].astype(dtype_mapping[col])
            df_list.append(df)
    except Exception as e:
        print(f"Ошибка при чтении и переименовании столбцов из файла: {file_path} - {e}")
    return df_list


def read_and_rename_columns_from_directory(directory_path, column_mapping, dtype_mapping):
    print(f"Чтение и переименование столбцов из директории {directory_path}...")
    all_df = []
    file_info = []
    for file_name in os.listdir(directory_path):
        if file_name.endswith('.xlsx'):
            file_path = os.path.join(directory_path, file_name)
            dfs_from_file = read_and_rename_columns_from_file(file_path, column_mapping, dtype_mapping)
            all_df.extend(dfs_from_file)

            # Записываем информацию о прочитанном файле
            inserted_date = datetime.now()
            kolchestvo_daty = len(dfs_from_file)
            kolichestvo_row_v_all = sum(len(df) for df in dfs_from_file)
            file_info.append((file_name, inserted_date, kolchestvo_daty, kolichestvo_row_v_all))
    return pd.concat(all_df, ignore_index=True), file_info


def create_table_if_not_exists(engine, table_name, table_definition_sql):
    print(f"Проверка существования таблицы '{table_name}' и создание, если отсутствует...")
    with engine.connect() as conn:
        table_exists_query = text(f"""
        SELECT COUNT(*)
        FROM information_schema.tables
        WHERE table_name = '{table_name}';
        """)
        result = conn.execute(table_exists_query).scalar()

        if result == 0:
            conn.execute(text(table_definition_sql))
            print(f"Таблица '{table_name}' успешно создана.")
        else:
            print(f"Таблица '{table_name}' уже существует.")


def create_table_and_insert_data(df, table_name, engine):
    print(f"Создание таблицы и вставка данных в '{table_name}'...")
    try:
        df.to_sql(table_name, con=engine, index=False, if_exists='replace')
        print(f"Данные успешно вставлены в таблицу '{table_name}' в базе данных.")
    except Exception as e:
        print(f"Ошибка при вставке данных в таблицу: {e}")


def insert_file_info(file_info, engine):
    print("Вставка информации о файлах...")
    try:
        metadata = MetaData(bind=engine)
        inserted_files_table = Table('[dbo].[INSERTED_FILES]', metadata, autoload=True)
        conn = engine.connect()
        insert_stmt = inserted_files_table.insert().values(file_info)
        conn.execute(insert_stmt)
    except Exception as e:
        print(f"Ошибка при вставке информации о файле: {e}")


def create_tru_reference_table(engine):
    print("Создание таблицы TRU_Reference...")
    create_table_sql = """
        CREATE TABLE TRU_Reference (
            UID INT PRIMARY KEY,
            TRU_Name NVARCHAR(255) UNIQUE NOT NULL
        );
    """
    create_table_if_not_exists(engine, "TRU_Reference", create_table_sql)


def populate_tru_reference_table(df, engine):
    print("Вставка уникальных названий TRU в TRU_Reference...")
    unique_tru_names = df[['TRU_Name']].dropna().drop_duplicates()
    unique_tru_names.to_sql('TRU_Temp', con=engine, index=False, if_exists='replace')

    with engine.connect() as conn:
        insert_query = """
            INSERT INTO TRU_Reference (TRU_Name)
            SELECT TT.TRU_Name
            FROM TRU_Temp TT
            LEFT JOIN TRU_Reference TR ON TT.TRU_Name = TR.TRU_Name
            WHERE TR.TRU_Name IS NULL;
        """
        drop_temp_table_query = "DROP TABLE TRU_Temp;"

        conn.execute(text(insert_query))
        conn.execute(text(drop_temp_table_query))


def add_uid_to_dataframe(df, engine):
    print("Объединение DataFrame с UID из TRU_Reference...")
    trus = pd.read_sql('SELECT UID, TRU_Name FROM TRU_Reference', con=engine)
    df = df.merge(trus, on='TRU_Name', how='left')
    return df


# Словарь для переименования столбцов
column_mapping = {
    r'Регистрационный номер ЭСФ \(\d{2}/\d{2}/\d{4}\)': 'ESF_Registration_Number',
    'Код органа государственных доходов': 'Tax_Authority_Code',
    'Вид счет-фактуры': 'Invoice_Type',
    'Статус ЭСФ': 'ESF_Status',
    'Статус ЭСФ после отправки получателю': 'ESF_Status_After_Sending',
    'Дата выписки': 'Issue_Date',
    'Дата выписки на бумажном носителе': 'Paper_Issue_Date',
    'Дата совершения оборота': 'Transaction_Date',
    'Ф.И.О., лица выписавшего ЭСФ': 'Issuer_Full_Name',
    'Номер учетной системы': 'System_Number',
    'Дата обновления СФ': 'Invoice_Update_Date',
    'ИИН/БИН': 'IIN_BIN',
    'Наименование поставщика по данным ИНИС на рус.': 'Supplier_Name_INIS',
    'Наименование поставщика по данным ИС ЭСФ': 'Supplier_Name_ESF',
    'Адрес места нахождения': 'Location_Address',
    'Номер свидетельства плательщика НДС': 'VAT_Certificate_Number',
    'Серия свидетельства плательщика НДС': 'VAT_Certificate_Series',
    'Номер документа, подтверждающего поставку ТРУ': 'Supply_Confirm_Document_Number',
    'Дата документа, подтверждающего поставку ТРУ': 'Supply_Confirm_Document_Date',
    'Дополнительные сведения': 'Additional_Information',
    'КБЕ': 'KBE',
    'ИИК': 'IBAN',
    'БИК': 'BIC',
    'Наименование банка': 'Bank_Name',
    'Доля участия': 'Participation_Share',
    'Дата выписки (поставщики)': 'Supplier_Issue_Date',
    'Категория поставщика': 'Supplier_Category',
    'Наименование получателя по данным ИС ЭСФ': 'Receiver_Name_ESF',
    'Наименование получателя по данным ИНИС на рус.': 'Receiver_Name_INIS',
    'ИИН/БИН.1': 'IIN_BIN_1',
    'Адрес места нахождения.1': 'Location_Address_1',
    'Дополнительные сведения.1': 'Additional_Information_1',
    'Код страны': 'Country_Code',
    'Доля участия.1': 'Participation_Share_1',
    'Дата выписки (получатели)': 'Receiver_Issue_Date',
    'Категория получателя': 'Receiver_Category',
    'ИИН/БИН.2': 'IIN_BIN_2',
    'Наименование': 'Name',
    'Адрес отправки': 'Shipping_Address',
    'ИИН/БИН.3': 'IIN_BIN_3',
    'Наименование грузополучателя': 'Consignee_Name',
    'Адрес доставки': 'Delivery_Address',
    'Код страны.1': 'Country_Code_1',
    'Номер договора (контракта) на поставку ТРУ': 'Supply_Contract_Number',
    'Дата договора (контракта) на поставку ТРУ': 'Supply_Contract_Date',
    'Условия оплаты по договору': 'Payment_Terms',
    'Способ отправления': 'Shipping_Method',
    'Номер доверенности на поставку ТРУ': 'Supply_Power_of_Attorney_Number',
    'Дата доверенности на поставку ТРУ': 'Supply_Power_of_Attorney_Date',
    'Пункт назначения': 'Destination_Point',
    'Наличие договора': 'Contract_Availability',
    'ИИК.1': 'IBAN_1',
    'Код ТРУ': 'TRU_Code',
    'Назначение платежа': 'Payment_Purpose',
    'БИК.1': 'BIC_1',
    'Порядковый номер ТРУ': 'TRU_Sequence_Number',
    'Признак происхождения товара, работ, услуг': 'Goods_Origin',
    'Наименование ТРУ': 'TRU_Name',
    'Наименование товаров в соответствии с Декларацией на товары или заявления о ввозе товаров и уплате косвенных налогов': 'Goods_Name_Declaration',
    'Код товара (ТН ВЭД)': 'Commodity_Code',
    'Единица измерения': 'Unit_of_Measurement',
    'Кол-во (объем)': 'Quantity',
    'Цена (тариф) за единицу ТРУ без косвенных налогов': 'Price_per_Unit_Excluding_Taxes',
    'Стоимость товаров, работ, услуг без учета косвенных налогов': 'Cost_Excluding_Taxes',
    'Ставка акциза': 'Excise_Rate',
    'Сумма акциза': 'Excise_Amount',
    'Размер оборота по реализации': 'Turnover_Size',
    'Ставка НДС': 'VAT_Rate',
    'Сумма НДС': 'VAT_Amount',
    'Стоимость товаров, работ, услуг с учетом косвенных налогов': 'Cost_Including_Taxes',
    'Номер декларации на товары, заявления в рамках ТС, СТ-1 или СТ-KZ': 'Declaration_Number',
    'Номер товарной позиции из заявления о ввозе товаров и уплате косвенных налогов или Декларации на товары': 'Item_Position_Number',
    'Дополнительные данные': 'Additional_Data',
    'Курс валюты': 'Currency_Rate',
    'Код валюты': 'Currency_Code',
    'Наименование валюты на рус.': 'Currency_Name',
    'Всего по счету, стоимость товаров, работ, услуг без учета косвенных налогов': 'Total_Cost_Excluding_Taxes',
    'Всего по счету, размер оборота по реализации': 'Total_Turnover_Size',
    'Всего по счету, сумма НДС': 'Total_VAT_Amount',
    'Всего по счету, стоимость товаров, работ, услуг с учетом косвенных налогов': 'Total_Cost_Including_Taxes',
    'ИИН/БИН участника совместной деятельности': 'Joint_Activity_Participant_IIN_BIN',
    'Номер продукта (товара, услуги)': 'Product_Number',
    'Количество (объём)': 'Quantity_Volume',
    'Сумма НДС.1': 'VAT_Amount_1',
    'Стоимость ТРУ с учетом НДС': 'Cost_Including_VAT',
    'Стоимость ТРУ без учета НДС': 'Cost_Excluding_VAT',
    'Размер оборота по реализации.1': 'Turnover_Size_1',
    'Регистрационный номер': 'Registration_Number',
    'Дата выписки СФ, к которому выписывается исправленный/дополнительный СФ': 'Corrected_Invoice_Date'
}

# Словарь для сопоставления названий столбцов с их типами
# Словарь для сопоставления названий столбцов с их типами
dtype_mapping = {
    'ESF_Registration_Number': 'str',
    'Tax_Authority_Code': 'str',
    'Invoice_Type': 'str',
    'ESF_Status': 'str',
    'ESF_Status_After_Sending': 'str',
    'Issue_Date': 'datetime64[ns]',
    'Paper_Issue_Date': 'datetime64[ns]',
    'Transaction_Date': 'datetime64[ns]',
    'Issuer_Full_Name': 'str',
    'System_Number': 'str',
    'Invoice_Update_Date': 'datetime64[ns]',
    'IIN_BIN': 'str',
    'Supplier_Name_INIS': 'str',
    'Supplier_Name_ESF': 'str',
    'Location_Address': 'str',
    'VAT_Certificate_Number': 'str',
    'VAT_Certificate_Series': 'str',
    'Supply_Confirm_Document_Number': 'str',
    'Supply_Confirm_Document_Date': 'datetime64[ns]',
    'Additional_Information': 'str',
    'KBE': 'str',
    'IBAN': 'str',
    'BIC': 'str',
    'Bank_Name': 'str',
    'Participation_Share': 'float',
    'Supplier_Issue_Date': 'datetime64[ns]',
    'Supplier_Category': 'str',
    'Receiver_Name_ESF': 'str',
    'Receiver_Name_INIS': 'str',
    'IIN_BIN_1': 'str',
    'Location_Address_1': 'str',
    'Additional_Information_1': 'str',
    'Country_Code': 'str',
    'Participation_Share_1': 'float',
    'Receiver_Issue_Date': 'datetime64[ns]',
    'Receiver_Category': 'str',
    'IIN_BIN_2': 'str',
    'Name': 'str',
    'Shipping_Address': 'str',
    'IIN_BIN_3': 'str',
    'Consignee_Name': 'str',
    'Delivery_Address': 'str',
    'Country_Code_1': 'str',
    'Supply_Contract_Number': 'str',
    'Supply_Contract_Date': 'datetime64[ns]',
    'Payment_Terms': 'str',
    'Shipping_Method': 'str',
    'Supply_Power_of_Attorney_Number': 'str',
    'Supply_Power_of_Attorney_Date': 'datetime64[ns]',
    'Destination_Point': 'str',
    'Contract_Availability': 'str',
    'IBAN_1': 'str',
    'TRU_Code': 'str',
    'Payment_Purpose': 'str',
    'BIC_1': 'str',
    'TRU_Sequence_Number': 'int',
    'Goods_Origin': 'str',
    'TRU_Name': 'str',
    'Goods_Name_Declaration': 'str',
    'Commodity_Code': 'str',
    'Unit_of_Measurement': 'str',
    'Quantity': 'float',
    'Price_per_Unit_Excluding_Taxes': 'float',
    'Cost_Excluding_Taxes': 'float',
    'Excise_Rate': 'float',
    'Excise_Amount': 'float',
    'Turnover_Size': 'float',
    'VAT_Rate': 'float',
    'VAT_Amount': 'float',
    'Cost_Including_Taxes': 'float',
    'Declaration_Number': 'str',
    'Item_Position_Number': 'str',
    'Additional_Data': 'str',
    'Currency_Rate': 'float',
    'Currency_Code': 'str',
    'Currency_Name': 'str',
    'Total_Cost_Excluding_Taxes': 'float',
    'Total_Turnover_Size': 'float',
    'Total_VAT_Amount': 'float',
    'Total_Cost_Including_Taxes': 'float',
    'Joint_Activity_Participant_IIN_BIN': 'str',
    'Product_Number': 'str',
    'Quantity_Volume': 'float',
    'VAT_Amount_1': 'float',
    'Cost_Including_VAT': 'float',
    'Cost_Excluding_VAT': 'float',
    'Turnover_Size_1': 'float',
    'Registration_Number': 'str',
    'Corrected_Invoice_Date': 'datetime64[ns]'
}

# Подключение к базе данных
connection_string = ('DRIVER={ODBC Driver 17 for SQL Server};'
                     'SERVER=10.200.100.24;'
                     'DATABASE=Dev_L2_X;'
                     'UID=CRM;'
                     'PWD=2983523456Dare;'
                     'TrustServerCertificate=yes;')

encoded_connection_string = urllib.parse.quote_plus(connection_string)
engine = create_engine(f'mssql+pyodbc:///?odbc_connect={encoded_connection_string}')

directory_path = '/Users/dauren/Desktop/esf_file/'

# Читаем, переименовываем и объединяем данные, а также сохраняем информацию о файлах
all_df, file_info = read_and_rename_columns_from_directory(directory_path, column_mapping, dtype_mapping)

# Создаем таблицу и вставляем данные из объединенного DataFrame
create_table_and_insert_data(all_df, 'ESF_FACT_D', engine)

# Создаем таблицу для информации о файлах и вставляем данные
insert_file_info(file_info, engine)

# Создаем таблицу для TRU_Reference (если она еще не существует)
create_tru_reference_table(engine)

# Вставляем уникальные названия TRU в TRU_Reference
populate_tru_reference_table(all_df, engine)

# Объединяем DataFrame с UID из TRU_Reference
all_df_with_uid = add_uid_to_dataframe(all_df, engine)

# Создаем таблицу и вставляем обновленные данные из объединенного DataFrame
create_table_and_insert_data(all_df_with_uid, 'ESF_FACT_C', engine)


Чтение и переименование столбцов из директории /Users/dauren/Desktop/esf_file/...
Чтение файла /Users/dauren/Desktop/esf_file/210740009061 ЭСФ реализация за апр-июль 2024.xlsx и переименование столбцов...
Нормализация имен столбцов...
Чтение файла /Users/dauren/Desktop/esf_file/111040018691 ЭСФ реализация за апр-июль 2024.xlsx и переименование столбцов...
Нормализация имен столбцов...
Чтение файла /Users/dauren/Desktop/esf_file/080140006125 ЭСФ реализация за апр-июль 2024.xlsx и переименование столбцов...
Нормализация имен столбцов...
Чтение файла /Users/dauren/Desktop/esf_file/140440025215 ЭСФ реализация за апр-июль 2024.xlsx и переименование столбцов...
Нормализация имен столбцов...
Чтение файла /Users/dauren/Desktop/esf_file/070240006325 ЭСФ реализация за апр-июль 2024.xlsx и переименование столбцов...
Нормализация имен столбцов...
Чтение файла /Users/dauren/Desktop/esf_file/211140004775 ЭСФ реализация за 2021-2024.xlsx и переименование столбцов...
Нормализация имен столбцов...
Чтен

ProgrammingError: (pyodbc.ProgrammingError) ('42000', '[42000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]Произойдет усечение строковых или двоичных данных в столбце "TRU_Name" таблицы "Dev_L2_X.dbo.TRU_Reference". Усеченное значение: "УДОБРЕНИЯ NOVALON FOLIAR 29-11-11+0.5MGO+ME. ВОДОРАСТВОРИМОЕ КОМПЛЕКСНОЕ УДОБРЕНИЕ С АКЦЕНТОМ НА АЗО". (2628) (SQLExecDirectW)')
[SQL: 
            INSERT INTO TRU_Reference (TRU_Name)
            SELECT TT.TRU_Name
            FROM TRU_Temp TT
            LEFT JOIN TRU_Reference TR ON TT.TRU_Name = TR.TRU_Name
            WHERE TR.TRU_Name IS NULL;
        ]
(Background on this error at: https://sqlalche.me/e/20/f405)