In [27]:
import pandas as pd
from pathlib import Path

def load_and_merge_data(train_path: str, additional_dir: str):
    """
    Загружает train и дополнительные таблицы, объединяет их по дате.
    
    :param train_path: Путь к файлу train.xlsx
    :param additional_dir: Директория с дополнительными файлами (data_1.xlsx ... data_10.xlsx)
    :return: Объединенный DataFrame
    """
    # Загрузка train данных
    train = pd.read_excel(train_path, parse_dates=['dt'], engine='openpyxl')
    
    # Загрузка дополнительных таблиц
    additional_files = list(Path(additional_dir).glob('*.xlsx'))
    dfs = [train]
    
    for file in additional_files:
        df = pd.read_excel(file, parse_dates=['dt'], engine='openpyxl')
        dfs.append(df)
    
    # Объединение всех таблиц по дате
    merged_df = dfs[0]
    for df in dfs[1:]:
        merged_df = pd.merge(merged_df, df, on='dt', how='outer', suffixes=('', '_DROP')).filter(regex='^(?!.*_DROP)')
    
    # Сортировка по дате
    merged_df.sort_values('dt', inplace=True)
    
    return merged_df

# Пример использования

merged_data = load_and_merge_data(
    train_path='train.xlsx',
    additional_dir='D:\Visual Studio Code\Intensive_Armatyra\data'
 )
print(f"Объединенный датасет: {merged_data.shape}")
print(merged_data.head(15))
merged_data.to_excel('merged_data.xlsx', index=False, engine='openpyxl')

  additional_dir='D:\Visual Studio Code\Intensive_Armatyra\data'


Объединенный датасет: (1880, 160)
           dt    price  Индекс стоимости грузоперевозок  Импорт цемента ЖД  \
1  2015-01-05  32900.0                              NaN                NaN   
2  2015-01-12  32500.0                              NaN                NaN   
3  2015-01-19  32000.0                              NaN                NaN   
4  2015-01-26  30700.0                              NaN                NaN   
5  2015-02-02  30300.0                              NaN                NaN   
6  2015-02-09  30300.0                              NaN                NaN   
7  2015-02-16  30100.0                              NaN                NaN   
8  2015-02-23  29400.0                              NaN                NaN   
9  2015-03-02  29200.0                              NaN                NaN   
10 2015-03-09  29000.0                              NaN                NaN   
11 2015-03-16  28700.0                              NaN                NaN   
12 2015-03-23  27800.0        