In [1]:
import pandas as pd
import openpyxl as ox

## Creating a column heading template for the output file

In [2]:
model_column = pd.read_excel('model.xlsx', sheet_name='АВТО', header=1, usecols="B:X")

In [3]:
columns_total = list(model_column.iloc[0])

## Processing incoming excel files: data cleaning and bringing data to the required format
### Stock 1

In [4]:
# loading data from the 1st rigth sheet 
stock_1 = pd.read_excel('stock1.xlsx', sheet_name=-1, header=10, usecols="B,F:I")

# renaming columns
stock_1 = stock_1.rename({'Unnamed: 1': 'Дата', 'Кол-во (т).1': 'вес', '№ накл': 'Ж.д. накладная / ТТН',
                    '№авто': 'Ваг./маш.', 'Грузополучатель ': 'Грузополучатель'}, axis=1)

# removing blank lines in a column 'Ж.д. накладная / ТТН'
stock_1 = stock_1.dropna(subset=['Ж.д. накладная / ТТН'])

# converting the date to the required format
stock_1['Дата'] = pd.to_datetime(stock_1['Дата'], errors='ignore')
stock_1['Дата'] = stock_1['Дата'].dt.strftime('%d.%m.%Y')

# filling the columns according to the input data
stock_1['Грузоотправитель'] = 'Склад № 1'
stock_1['Закупка товара осуществляется от компании (внутренняя)'] = 'ООО "Наша Компания"'
stock_1['Покупатель'] = stock_1['Грузополучатель']
stock_1['Портландцемент Марки'] = 'Цемент ЦЕМ I 42,5Н Навал'
stock_1['Поставщик'] = 'перевалка'

In [5]:
# calculating empty columns
missing_col_s1 = list(set(columns_total) - set(stock_1.columns))

In [6]:
# filling the columns with NaT values
for i in missing_col_s1:
    stock_1[i] = pd.NaT 

In [7]:
# assigning the required column order
stock_1 = stock_1[columns_total]

### Stock 2

In [8]:
# loading data from two right sheets, as goods are loaded from two silos
sheets = [-2, -1]
dfs = []

for name in sheets:
    df = pd.read_excel("stock2.xlsx", sheet_name=name, header=9, usecols="F:H, J, L")
    df = df[1:]
    
    # renaming columns
    df = df.rename({'Unnamed: 5': 'Дата', 'Кол-во (т).1': 'вес', 'Unnamed: 7': 'Ж.д. накладная / ТТН',
                    '№авто': 'Ваг./маш.', 'Грузополучатель ': 'Грузополучатель'}, axis=1)
    
    # removing blank lines in a column 'Ж.д. накладная / ТТН'
    df = df.dropna(subset=['Ваг./маш.'])
    
    # converting the date to the required format
    df['Дата'] = pd.to_datetime(df['Дата'], errors='ignore')
    df['Дата'] = df['Дата'].dt.strftime('%d.%m.%Y')
    
    dfs.append(df)
    
# data concatenation
stock_2 = pd.concat([dfs[0], dfs[1]], axis=0)
stock_2 = stock_2.sort_values('Дата', ascending=True)

# filling the columns according to the input data
stock_2['Грузоотправитель'] = 'Склад № 2'
stock_2['Закупка товара осуществляется от компании (внутренняя)'] = 'ООО "Наша Компания"'
stock_2['Покупатель'] = stock_2['Грузополучатель']
stock_2['Поставщик'] = 'перевалка'

In [9]:
# calculating empty columns
missing_col_s2 = list(set(columns_total) - set(stock_2.columns))

In [10]:
# filling the columns with NaT values
for i in missing_col_s2:
    stock_2[i] = pd.NaT 

In [11]:
# assigning the required column order
stock_2 = stock_2[columns_total]

### Stock 3

In [12]:
# loading data from the first left sheet
stock_3 = pd.read_excel("stock3.xlsx", sheet_name=0, header=3)

# renaming columns
stock_3 = stock_3.rename({'Номер накладной': 'Ж.д. накладная / ТТН', 'Дата накладной': 'Дата',
                    'Номенклатура': 'Портландцемент Марки', 'Количество в основной ЕИ': 'вес',
                    'Номер машины': 'Ваг./маш.'}, axis=1)

# removing the column 'Ф.И.О. водителя'
stock_3 = stock_3.drop('Ф.И.О. водителя', axis=1)

# converting the date to the required format
stock_3['Дата'] = pd.to_datetime(stock_3['Дата'], errors='ignore')
stock_3['Дата'] = stock_3['Дата'].dt.strftime('%d.%m.%Y')
stock_3 = stock_3.sort_values('Дата', ascending=True)

# filling the columns according to the input data
stock_3['Договор закупки №'] = 'ЦЕМ/147-2021'
stock_3['Договор продажи заключен от компании:'] = 'ООО "Наша Компания"'
stock_3['Закупка товара осуществляется от компании (внутренняя)'] = 'ООО "Вторая Наша Компания"'
stock_3['Покупатель'] = stock_3['Грузополучатель']
stock_3['Поставщик'] = 'ООО "Наш Поставщик"'

In [13]:
# calculating empty columns
missing_col_s3 = list(set(columns_total) - set(stock_3.columns))

In [14]:
# filling the columns with NaT values
for i in missing_col_s3:
    stock_3[i] = pd.NaT 

In [15]:
# assigning the required column order
stock_3 = stock_3[columns_total]

### Stock 4

In [16]:
# loading data from two right sheets, as goods are loaded from two silos
sheets = ["мордва", "питер"]
dfs = []

for i in range(len(sheets)):
    df = pd.read_excel("stock4.xlsx", sheet_name=i, header=9, usecols="B,F:N")
    
    # renaming columns
    df = df.rename({'Unnamed: 1': 'Дата', 'Кол-во (т).1': 'вес', 'Марка цемента': 'Портландцемент Марки',
                    '№авто': 'Ваг./маш.', 'Грузополучатель ': 'Грузополучатель',
                    'Стоимость доставки': 'Ставка перевозки, руб/тн с НДС',
                    'Сумма доставки (1 м)': 'Ставка перевозки, руб/маш. с НДС',
                    '№ накл.': 'Ж.д. накладная / ТТН'}, axis=1)
    
    # removing blank lines in a column 'Грузополучатель'
    df = df.dropna(subset=['Грузополучатель'])
    
    # converting the date to the required format
    df['Дата'] = pd.to_datetime(df['Дата'], errors='ignore')
    df['Дата'] = df['Дата'].dt.strftime('%d.%m.%Y')
    
    # removing blank columns
    df = df.dropna(how='all', axis=1)
    
    # filling the columns according to the input data
    df['Тип вагона / +кто нанимал перевозчика'] = 'ООО "Наша Третья Компания"'
    df['Закупка товара осуществляется от компании (внутренняя)'] = 'ООО "Наша Компания"'
    df['Грузоотправитель'] = 'Склад № 4'
    df['Договор продажи заключен от компании:'] = 'ООО "Наша Третья Компания"'
    df['Поставщик'] = 'перевалка'
    df['Покупатель'] = df['Грузополучатель']
    df['Ставка перевозки, руб/тн с НДС'] = 300.00
    df['Ставка перевозки, руб/маш. с НДС'] = df['Ставка перевозки, руб/тн с НДС'] * df['вес']
    
    dfs.append(df)

In [17]:
# data concatenation
stock_4 = pd.concat([dfs[0], dfs[1]], axis=0)
stock_4 = stock_4.sort_values('Дата', ascending=True)

In [18]:
# calculating empty columns
missing_col_s4 = list(set(columns_total) - set(stock_4.columns))

In [19]:
# filling the columns with NaT values
for i in missing_col_s4:
    stock_4[i] = pd.NaT 

In [20]:
# assigning the required column order
stock_4 = stock_4[columns_total]

## Combining all registers into a common one

In [21]:
total_all = pd.concat([stock_1, stock_2, stock_3, stock_4], axis=0)
total_all = total_all.sort_values('Дата', ascending=True)

## Loading managers from an input file

In [22]:
managers = pd.read_excel('model.xlsx', sheet_name='Менеджер')

## Filling out the column with manager names depending on the name of the counterparty

In [23]:
total_all = pd.merge(total_all, managers, on=['Грузополучатель'], how='left')
total_all['Менеджер_x'] = total_all['Менеджер_y']
total_all.drop('Менеджер_y', axis=1, inplace=True)
total_all.columns = [columns_total]

## Loading an output file template using openpyxl

In [24]:
wb = ox.load_workbook('model.xlsx')
sheet = wb["АВТО"]

## Defining the starting fill cell data

In [25]:
startrow = 4
startcol = 2

## Adding to total table with necessary format

In [26]:
for ir in range(0, len(total_all)):
    for ic in range(0, len(total_all.iloc[ir])):
        wb["АВТО"].cell(startrow + ir, startcol + ic).value = total_all.iloc[ir][ic]
        sheet["A{}".format(startrow + ir)].value = startrow + ir - 3

sheet.auto_filter.ref = "A3:X3"
sheet.freeze_panes = "B4"

## Saving the final data in the required format

In [27]:
wb.save('total.xlsx')