<a href="https://colab.research.google.com/github/tsm-mehmetakiftasoz/tsm_makif/blob/main/sveta_icin_malzemeno_tedarikci%20.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Предназначено для объединения всех отчетов. Имена должны быть строго идентичными, и при выгрузке из SAP они должны быть в формате MAKIF_REPORT, иначе код не будет работать!!!

Необходимые отчеты:
*   ME5A_2022, ME5A_2023, ME5A_2024, ME5A_2025,ME5A_2026 (могут быть выгружены из SAP в формате 01.01.202X-31.12.202X)
*   ME2N_2022, ME2N_2023, ME2N_2024, ME2N_2025,ME2N_2026 (могут быть выгружены из SAP в формате 01.01.202X-31.12.202X)
*   zmm059_2022, zmm059_2023, zmm059_2025,zmm059_2026, zmm059_2024_1, zmm059_2024_2, zmm059_2024_3, zmm059_2024_4.(Отчеты за 2022, 2023, 2025 годы могут быть выгружены из SAP в формате 01.01.202X-31.12.202X. Для 2024 года граничные даты: 23.04.2024, 15.07.2024, 29.11.2024 и 01.12.2024 по 31.12.2024 (на 30.11 система выдает ошибку)).
*   zmb51_2022, zmb51_2023, zmb51_2025_1 (01.01.25-31.05.25), zmb51_2025_2 (01.06.2025-31.12.2025),zmb51_2026, zmb51_2024_1 (01.01-30.04.24), zmb51_2024_2 (01.05.2024-31.07.2024), zmb51_2024_3 (01.08.2024-30.09.2024), zmb51_2024_4 (01.10.2024-30.11.2024), zmb51_2024_5 (01.12.2024-31.12.2024)
*   ZMM067_2022(01.01.202X-31.12.202X) , ZMM067_2023(01.01.202X-31.12.202X), ZMM067_2024_1(01.01-31.05.24),ZMM067_2024_2(01.06-31.12.24),ZMM067_2025(01.01.202X-31.12.202X),ZMM067_2026

In [1]:
!pip install pandas
!pip install xlsxwriter

Collecting xlsxwriter
  Downloading xlsxwriter-3.2.9-py3-none-any.whl.metadata (2.7 kB)
Downloading xlsxwriter-3.2.9-py3-none-any.whl (175 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m175.3/175.3 kB[0m [31m4.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: xlsxwriter
Successfully installed xlsxwriter-3.2.9


In [2]:
import pandas as pd
import numpy as np
from google.colab import files
import os
import zipfile

In [3]:
def duzenle_sayi_sutunu(df, sutun_adi):
    """
    Sayısal değerleri metin olarak tutan ve binlik/ondalık ayracı içeren sütunu dönüştürür.
    - Nokta (.) binlik ayracı olarak kaldırılır
    - Virgül (,) ondalık ayracı olarak noktaya çevrilir
    - Float olarak dönüştürülür
    - Eğer tam sayı ise integer olarak, değilse float olarak kalır
    - Sonuç string olarak döndürülür (görsel temizlik için)

    Parametreler:
    df : pd.DataFrame
    sutun_adi : str

    Dönüş:
    df (işlenmiş hali)
    """
    df[sutun_adi] = (
        df[sutun_adi]
        .astype(str)
        .str.replace(" ", "", regex=False)
        .str.replace(".", "", regex=False)
        .str.replace(",", ".", regex=False)
        .astype(float)
        .apply(lambda x: str(int(x)) if x.is_integer() else str(x))
    )
    return df


In [4]:
def temizle_ve_cevir(x):
    try:
        return str(int(float(str(x).strip())))
    except:
        return str(x).strip()


In [5]:
# Temizlenecek değerler listesi
temizlenecekler = ["nan", "Nan", "NaN", ""," ","0","naN","nAn","NAn","nAN"]

def temizle_nan(value):
    if str(value).strip().lower() in [x.lower() for x in temizlenecekler]:
        return pd.NA
    return value


In [6]:
# Güvenli filtreleme fonksiyonu
def dolu_mi(x):
    return pd.notna(x) and str(x).strip() != "" and str(x).strip().upper() != "<NA>"


In [7]:
#me5a'nın yüklenmesi
df_me5a_2022 = pd.read_csv('/content/ME5A_2022.csv', sep=None, engine='python')
df_me5a_2023 = pd.read_csv('/content/ME5A_2023.csv', sep=None, engine='python')
df_me5a_2024 = pd.read_csv('/content/ME5A_2024.csv', sep=None, engine='python')
df_me5a_2025 = pd.read_csv('/content/ME5A_2025.csv', sep=None, engine='python')
df_me5a_2026 = pd.read_csv('/content/ME5A_2026.csv', sep=None, engine='python')
# sep=None will automatically detect the delimiter
# engine='python' is slower but more robust for complex cases
#zmm059un yüklenmesi
df_zmm059_2022 = pd.read_csv('/content/zmm059_2022.csv', sep=None, engine='python')
df_zmm059_2023 = pd.read_csv('/content/zmm059_2023.csv', sep=None, engine='python')
df_zmm059_2024_1 = pd.read_csv('/content/zmm059_2024_1.csv', sep=None, engine='python')
df_zmm059_2024_2 = pd.read_csv('/content/zmm059_2024_2.csv', sep=None, engine='python')
df_zmm059_2024_3 = pd.read_csv('/content/zmm059_2024_3.csv', sep=None, engine='python')
df_zmm059_2024_4 = pd.read_csv('/content/zmm059_2024_4.csv', sep=None, engine='python')
df_zmm059_2025 = pd.read_csv('/content/zmm059_2025.csv', sep=None, engine='python')
df_zmm059_2026 = pd.read_csv('/content/zmm059_2026.csv', sep=None, engine='python')
#yardımcı tabloların yüklenmesi
df_tedarikci_listesi = pd.read_csv('/content/tedarikci_isim.csv', sep=None, engine='python')
df_material_list = pd.read_csv('/content/material_list.csv', sep=None, engine='python')
# sep=None will automatically detect the delimiter
# engine='python' is slower but more robust for complex cases
#me2n'in yüklenmesi
df_me2n_2022 = pd.read_csv('/content/ME2N_2022.csv', sep=None, engine='python', dtype={"Единица цены":object})
df_me2n_2023 = pd.read_csv('/content/ME2N_2023.csv', sep=None, engine='python', dtype={"Единица цены":object})
df_me2n_2024 = pd.read_csv('/content/ME2N_2024.csv', sep=None, engine='python', dtype={"Единица цены":object})
df_me2n_2025 = pd.read_csv('/content/ME2N_2025.csv', sep=None, engine='python', dtype={"Единица цены":object})
df_me2n_2026 = pd.read_csv('/content/ME2N_2026.csv', sep=None, engine='python', dtype={"Единица цены":object})
# sep=None will automatically detect the delimiter
# engine='python' is slower but more robust for complex cases
#zmb51'in yüklenmesi
df_zmb51_2022 = pd.read_csv('/content/zmb51_2022.csv', sep=None, engine='python')
df_zmb51_2023 = pd.read_csv('/content/zmb51_2023.csv', sep=None, engine='python')
df_zmb51_2024_1 = pd.read_csv('/content/zmb51_2024_1.csv', sep=None, engine='python')
df_zmb51_2024_2 = pd.read_csv('/content/zmb51_2024_2.csv', sep=None, engine='python')
df_zmb51_2024_3 = pd.read_csv('/content/zmb51_2024_3.csv', sep=None, engine='python')
df_zmb51_2024_4 = pd.read_csv('/content/zmb51_2024_4.csv', sep=None, engine='python')
df_zmb51_2024_5 = pd.read_csv('/content/zmb51_2024_5.csv', sep=None, engine='python')
#df_zmb51_2024_6 = pd.read_csv('/content/zmb51_2024_6.csv', sep=None, engine='python')
#df_zmb51_2024_7 = pd.read_csv('/content/zmb51_2024_7.csv', sep=None, engine='python')
df_zmb51_2025 = pd.read_csv('/content/zmb51_2025.csv', sep=None, engine='python')
df_zmb51_2025_2 = pd.read_csv('/content/zmb51_2025-2.csv', sep=None, engine='python')
df_zmb51_2026 = pd.read_csv('/content/zmb51_2026.csv', sep=None, engine='python')
# sep=None will automatically detect the delimiter
# engine='python' is slower but more robust for complex cases
#zmm067'in yüklenmesi
df_zmm067_2022 = pd.read_csv('/content/ZMM067_2022.csv', sep=None, engine='python')
df_zmm067_2023 = pd.read_csv('/content/ZMM067_2023.csv', sep=None, engine='python')
df_zmm067_2024_1 = pd.read_csv('/content/ZMM067_2024_1.csv', sep=None, engine='python')
df_zmm067_2024_2 = pd.read_csv('/content/ZMM067_2024_2.csv', sep=None, engine='python')
df_zmm067_2025 = pd.read_csv('/content/ZMM067_2025.csv', sep=None, engine='python')
df_zmm067_2026 = pd.read_csv('/content/ZMM067_2026.csv', sep=None, engine='python')
#
#zpp001 yüklenmesi
zpp001 = pd.read_csv('/content/ZPP001.csv', sep=None, engine='python')



In [8]:
#ilk sutuna yıl yazdırma me5a
df_me5a_2022["ГОД"] = "2022"
cols = ["ГОД"] + [col for col in df_me5a_2022.columns if col != "ГОД"]
df_me5a_2022 = df_me5a_2022[cols]
#
df_me5a_2023["ГОД"] = "2023"
cols = ["ГОД"] + [col for col in df_me5a_2023.columns if col != "ГОД"]
df_me5a_2023 = df_me5a_2023[cols]
#
df_me5a_2024["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_me5a_2024.columns if col != "ГОД"]
df_me5a_2024 = df_me5a_2024[cols]
#
df_me5a_2025["ГОД"] = "2025"
cols = ["ГОД"] + [col for col in df_me5a_2025.columns if col != "ГОД"]
df_me5a_2025 = df_me5a_2025[cols]
#
df_me5a_2026["ГОД"] = "2026"
cols = ["ГОД"] + [col for col in df_me5a_2026.columns if col != "ГОД"]
df_me5a_2026 = df_me5a_2026[cols]

#ilk sutuna yıl yazdırma zmm059
df_zmm059_2022["ГОД"] = "2022"
cols = ["ГОД"] + [col for col in df_zmm059_2022.columns if col != "ГОД"]
df_zmm059_2022 = df_zmm059_2022[cols]
#
df_zmm059_2023["ГОД"] = "2023"
cols = ["ГОД"] + [col for col in df_zmm059_2023.columns if col != "ГОД"]
df_zmm059_2023 = df_zmm059_2023[cols]
#
df_zmm059_2025["ГОД"] = "2025"
cols = ["ГОД"] + [col for col in df_zmm059_2025.columns if col != "ГОД"]
df_zmm059_2025 = df_zmm059_2025[cols]
#
df_zmm059_2024_1["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmm059_2024_1.columns if col != "ГОД"]
df_zmm059_2024_1 = df_zmm059_2024_1[cols]
#
df_zmm059_2024_2["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmm059_2024_2.columns if col != "ГОД"]
df_zmm059_2024_2 = df_zmm059_2024_2[cols]
#
df_zmm059_2024_3["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmm059_2024_3.columns if col != "ГОД"]
df_zmm059_2024_3 = df_zmm059_2024_3[cols]
#
df_zmm059_2024_4["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmm059_2024_4.columns if col != "ГОД"]
df_zmm059_2024_4 = df_zmm059_2024_4[cols]
#
df_zmm059_2026["ГОД"] = "2026"
cols = ["ГОД"] + [col for col in df_zmm059_2026.columns if col != "ГОД"]
df_zmm059_2026 = df_zmm059_2026[cols]

#ilk sutuna yıl yazdırma me2n
df_me2n_2022["ГОД"] = "2022"
cols = ["ГОД"] + [col for col in df_me2n_2022.columns if col != "ГОД"]
df_me2n_2022 = df_me2n_2022[cols]
#
df_me2n_2023["ГОД"] = "2023"
cols = ["ГОД"] + [col for col in df_me2n_2023.columns if col != "ГОД"]
df_me2n_2023 = df_me2n_2023[cols]
#
df_me2n_2024["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_me2n_2024.columns if col != "ГОД"]
df_me2n_2024 = df_me2n_2024[cols]
#
df_me2n_2025["ГОД"] = "2025"
cols = ["ГОД"] + [col for col in df_me2n_2025.columns if col != "ГОД"]
df_me2n_2025 = df_me2n_2025[cols]
#
df_me2n_2026["ГОД"] = "2026"
cols = ["ГОД"] + [col for col in df_me2n_2026.columns if col != "ГОД"]
df_me2n_2026 = df_me2n_2026[cols]
#ilk sutuna yıl yazdırma zmb51
df_zmb51_2022["ГОД"] = "2022"
cols = ["ГОД"] + [col for col in df_zmb51_2022.columns if col != "ГОД"]
df_zmb51_2022 = df_zmb51_2022[cols]
#
df_zmb51_2023["ГОД"] = "2023"
cols = ["ГОД"] + [col for col in df_zmb51_2023.columns if col != "ГОД"]
df_zmb51_2023 = df_zmb51_2023[cols]
#
df_zmb51_2024_1["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmb51_2024_1.columns if col != "ГОД"]
df_zmb51_2024_1 = df_zmb51_2024_1[cols]
#
df_zmb51_2024_2["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmb51_2024_2.columns if col != "ГОД"]
df_zmb51_2024_2 = df_zmb51_2024_2[cols]
#
df_zmb51_2024_3["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmb51_2024_3.columns if col != "ГОД"]
df_zmb51_2024_3 = df_zmb51_2024_3[cols]
#
df_zmb51_2024_4["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmb51_2024_4.columns if col != "ГОД"]
df_zmb51_2024_4 = df_zmb51_2024_4[cols]
#
df_zmb51_2024_5["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmb51_2024_5.columns if col != "ГОД"]
df_zmb51_2024_5 = df_zmb51_2024_5[cols]
#
df_zmb51_2025["ГОД"] = "2025"
cols = ["ГОД"] + [col for col in df_zmb51_2025.columns if col != "ГОД"]
df_zmb51_2025 = df_zmb51_2025[cols]
#
df_zmb51_2025_2["ГОД"] = "2025"
cols = ["ГОД"] + [col for col in df_zmb51_2025_2.columns if col != "ГОД"]
df_zmb51_2025_2 = df_zmb51_2025_2[cols]
#
df_zmb51_2026["ГОД"] = "2026"
cols = ["ГОД"] + [col for col in df_zmb51_2026.columns if col != "ГОД"]
df_zmb51_2026 = df_zmb51_2026[cols]
#ilk sutuna yıl yazdırma zmm067
# 2022
df_zmm067_2022["ГОД"] = "2022"
cols = ["ГОД"] + [col for col in df_zmm067_2022.columns if col != "ГОД"]
df_zmm067_2022 = df_zmm067_2022[cols]

# 2023
df_zmm067_2023["ГОД"] = "2023"
cols = ["ГОД"] + [col for col in df_zmm067_2023.columns if col != "ГОД"]
df_zmm067_2023 = df_zmm067_2023[cols]

# 2024_1
df_zmm067_2024_1["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmm067_2024_1.columns if col != "ГОД"]
df_zmm067_2024_1 = df_zmm067_2024_1[cols]

# 2024_2
df_zmm067_2024_2["ГОД"] = "2024"
cols = ["ГОД"] + [col for col in df_zmm067_2024_2.columns if col != "ГОД"]
df_zmm067_2024_2 = df_zmm067_2024_2[cols]

# 2025
df_zmm067_2025["ГОД"] = "2025"
cols = ["ГОД"] + [col for col in df_zmm067_2025.columns if col != "ГОД"]
df_zmm067_2025 = df_zmm067_2025[cols]
# 2026
df_zmm067_2026["ГОД"] = "2026"
cols = ["ГОД"] + [col for col in df_zmm067_2026.columns if col != "ГОД"]
df_zmm067_2026 = df_zmm067_2026[cols]

In [9]:
#me5a birleştirme
df_listesi_me5a = [df_me5a_2026,df_me5a_2025,df_me5a_2024, df_me5a_2023,df_me5a_2022 ]
df_me5a_2022_2025 = pd.concat(df_listesi_me5a, ignore_index=True)
# zmm059 birleştirme
df_listesi_zmm059 = [df_zmm059_2026,df_zmm059_2025, df_zmm059_2024_4, df_zmm059_2024_3, df_zmm059_2024_2, df_zmm059_2024_1, df_zmm059_2023,df_zmm059_2022 ]
df_zmm059_2022_2025 = pd.concat(df_listesi_zmm059, ignore_index=True)
#me2n birleştirme
df_listesi_me2n = [df_me2n_2026,df_me2n_2025, df_me2n_2024, df_me2n_2023,df_me2n_2022]
df_me2n_2022_2025 = pd.concat(df_listesi_me2n, ignore_index=True)
#zmb51 birleştirme
df_listesi_zmb51 = [df_zmb51_2026,df_zmb51_2025_2,df_zmb51_2025,df_zmb51_2024_5,df_zmb51_2024_4,df_zmb51_2024_3,
                    df_zmb51_2024_2,df_zmb51_2024_1,df_zmb51_2023,df_zmb51_2022
    ]
birlesik_df_zmb51 = pd.concat(df_listesi_zmb51, ignore_index=True)
#zmm067 birleştirme
df_listesi_zmm067 = [df_zmm067_2026,df_zmm067_2025,df_zmm067_2024_2,df_zmm067_2024_1,df_zmm067_2023,df_zmm067_2022]
df_zmm067_2022_2025 = pd.concat(df_listesi_zmm067, ignore_index=True)

In [10]:
#yedek tablolar
df_me5a_2022_2025_yedek=df_me5a_2022_2025.copy()
df_zmm059_2022_2025_yedek=df_zmm059_2022_2025.copy()
df_me2n_2022_2025_yedek=df_me2n_2022_2025.copy()
birlesik_df_zmb51_yedek=birlesik_df_zmb51.copy()
df_zmm067_2022_2025_yedek=df_zmm067_2022_2025.copy()

In [11]:
#zmm059
df_zmm059_2022_2025["﻿Документ закупки"] = df_zmm059_2022_2025["﻿Документ закупки"].apply(temizle_ve_cevir)
df_zmm059_2022_2025.rename(columns={'﻿Документ закупки': 'Документ_закупки'}, inplace=True)
df_zmm059_2022_2025["Материал"] = df_zmm059_2022_2025["Материал"].apply(temizle_ve_cevir)
df_zmm059_2022_2025["Заявка"] = df_zmm059_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Количество ЗП")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Минимальная цена ЗП")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Единица ЗП")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Цена нетто ЗП")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Итого цена нетто")
df_zmm059_2022_2025["Дата создания"] = pd.to_datetime(df_zmm059_2022_2025["Дата создания"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025["Дата поставки"] = pd.to_datetime(df_zmm059_2022_2025["Дата поставки"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025["Дата доставки, одобренная Поставщиком"] = pd.to_datetime(df_zmm059_2022_2025["Дата доставки, одобренная Поставщиком"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025["Группа закупок"] = df_zmm059_2022_2025["Группа закупок"].apply(temizle_ve_cevir)
df_zmm059_2022_2025["БЕ"] = df_zmm059_2022_2025["БЕ"].apply(temizle_ve_cevir)
df_zmm059_2022_2025["Закуп. организация"] = df_zmm059_2022_2025["Закуп. организация"].apply(temizle_ve_cevir)
df_zmm059_2022_2025["Поставщик"] = df_zmm059_2022_2025["Поставщик"].apply(temizle_ve_cevir)
df_zmm059_2022_2025["Дата создания.1"] = pd.to_datetime(df_zmm059_2022_2025["Дата создания.1"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Цена заказа нетто")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Стоимость брутто")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Недопоставленное количество")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Количество поставки")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Сумма брутто")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Количество по счету")
df_zmm059_2022_2025["Дата проводки"] = pd.to_datetime(df_zmm059_2022_2025["Дата проводки"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Количество по счету.1")
df_zmm059_2022_2025 = duzenle_sayi_sutunu(df_zmm059_2022_2025, "Остаток количества по счету")
df_zmm059_2022_2025["Дата контракта"] = pd.to_datetime(df_zmm059_2022_2025["Дата контракта"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025["Дата вступления в силу контракта"] = pd.to_datetime(df_zmm059_2022_2025["Дата вступления в силу контракта"], format="%d.%m.%Y", errors="coerce").dt.date
df_zmm059_2022_2025["Дата окончания действия договора"] = pd.to_datetime(df_zmm059_2022_2025["Дата окончания действия договора"], format="%d.%m.%Y", errors="coerce").dt.date


In [12]:
df_me5a_2022_2025.columns

Index(['ГОД', '﻿Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
       'Дата заказа', 'Долгосрочный договор', 'ЗатребованКолич',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование', 'Инвентарный номер', 'Краткий текст',
       'Закуп. организация', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования'],
      dtype='object')

In [13]:
#ME5A
df_me5a_2022_2025["﻿Заявка"] = df_me5a_2022_2025["﻿Заявка"].apply(temizle_ve_cevir)
df_me5a_2022_2025.rename(columns={'﻿Заявка': 'Заявка'}, inplace=True)
df_me5a_2022_2025.rename(columns={'Индикатор удаления': 'Индикатор удаления_B3'}, inplace=True)
df_me5a_2022_2025["Материал"] = df_me5a_2022_2025["Материал"].apply(temizle_ve_cevir)
df_me5a_2022_2025["'Дата заявки"] = pd.to_datetime(df_me5a_2022_2025["Дата заявки"], format="%d.%m.%Y", errors="coerce").dt.date
df_me5a_2022_2025["Группа закупок"] = df_me5a_2022_2025["Группа закупок"].apply(temizle_ve_cevir)
df_me5a_2022_2025["'Дата заявки"] = pd.to_datetime(df_me5a_2022_2025["Дата заявки"], format="%d.%m.%Y", errors="coerce").dt.date
df_me5a_2022_2025["Дата изменения"] = df_me5a_2022_2025["Дата изменения"].apply(temizle_ve_cevir)
df_me5a_2022_2025["Заказ на поставку"] = df_me5a_2022_2025["Заказ на поставку"].apply(temizle_ve_cevir)
df_me5a_2022_2025["Позиция ЗкзНаПостав"] = df_me5a_2022_2025["Позиция ЗкзНаПостав"].apply(temizle_ve_cevir)
df_me5a_2022_2025 = duzenle_sayi_sutunu(df_me5a_2022_2025, "ЗатребованКолич")
df_me5a_2022_2025 = duzenle_sayi_sutunu(df_me5a_2022_2025, "Заказанное к-во")
df_me5a_2022_2025["Закуп. организация"] = df_me5a_2022_2025["Закуп. организация"].apply(temizle_ve_cevir)
df_me5a_2022_2025["Номер проекта"] = df_me5a_2022_2025["Номер проекта"].apply(temizle_ve_cevir)
df_me5a_2022_2025["Дата деблокирования"] = pd.to_datetime(df_me5a_2022_2025["Дата деблокирования"], format="%d.%m.%Y", errors="coerce").dt.date


In [14]:
df_me5a_cleaned =df_me5a_2022_2025.copy()

In [15]:
#me2n
df_me2n_2022_2025["﻿Документ закупки"] = df_me2n_2022_2025["﻿Документ закупки"].apply(temizle_ve_cevir)
df_me2n_2022_2025.rename(columns={'﻿Документ закупки': 'Документ закупки'}, inplace=True)
df_me2n_2022_2025["Дата документа"] = pd.to_datetime(df_me2n_2022_2025["Дата документа"], format="%d.%m.%Y", errors="coerce").dt.date
df_me2n_2022_2025["Заявка"] = df_me2n_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_me2n_2022_2025["Материал"] = df_me2n_2022_2025["Материал"].apply(temizle_ve_cevir)
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "Объем заказа")
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "еще поставить (количество)")
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "Количество в СЕИ")
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "Цена нетто")
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "Единица цены")
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "СтоимЗаказа нетто")
df_me2n_2022_2025 = duzenle_sayi_sutunu(df_me2n_2022_2025, "Еще для поставки (стоимость)")
df_me2n_2022_2025["Дата поставки"] = pd.to_datetime(df_me2n_2022_2025["Дата поставки"], format="%d.%m.%Y", errors="coerce").dt.date


In [16]:
#zmb51
birlesik_df_zmb51 = duzenle_sayi_sutunu(birlesik_df_zmb51, "Сумма во ВВ")
birlesik_df_zmb51["Партия"] = birlesik_df_zmb51["Партия"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Материал"] = birlesik_df_zmb51["Материал"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Дата ввода"] = pd.to_datetime(birlesik_df_zmb51["Дата ввода"], format="%d.%m.%Y", errors="coerce").dt.date
birlesik_df_zmb51["Дата документа"] = pd.to_datetime(birlesik_df_zmb51["Дата документа"], format="%d.%m.%Y", errors="coerce").dt.date
birlesik_df_zmb51["Дата проводки"] = pd.to_datetime(birlesik_df_zmb51["Дата проводки"], format="%d.%m.%Y", errors="coerce").dt.date
birlesik_df_zmb51["Внутренний заказ"] = birlesik_df_zmb51["Внутренний заказ"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Заказ на поставку"] = birlesik_df_zmb51["Заказ на поставку"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Позиция"] = birlesik_df_zmb51["Позиция"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Документ материала"] = birlesik_df_zmb51["Документ материала"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Поз. док. материала"] = birlesik_df_zmb51["Поз. док. материала"].apply(temizle_ve_cevir)
birlesik_df_zmb51 = duzenle_sayi_sutunu(birlesik_df_zmb51, "Кол-во в ЕИ ввода")
birlesik_df_zmb51 = duzenle_sayi_sutunu(birlesik_df_zmb51, "Количество")
birlesik_df_zmb51['Поставщик'] = birlesik_df_zmb51['Поставщик'].apply(temizle_ve_cevir)
birlesik_df_zmb51.rename(columns={'﻿Вид движения': 'Вид движения'}, inplace=True)


In [17]:
#zmm067
df_zmm067_2022_2025["﻿Заявка"] = df_zmm067_2022_2025["﻿Заявка"].apply(temizle_ve_cevir)
df_zmm067_2022_2025.rename(columns={'﻿Заявка': 'Заявка'}, inplace=True)
df_zmm067_2022_2025["Позиция заявки"] = df_zmm067_2022_2025["Позиция заявки"].apply(temizle_ve_cevir)
df_zmm067_2022_2025["Материал"] = df_zmm067_2022_2025["Материал"].apply(temizle_ve_cevir)
df_zmm067_2022_2025["Заказ на поставку"] = df_zmm067_2022_2025["Заказ на поставку"].apply(temizle_ve_cevir)
df_zmm067_2022_2025["Позиция ЗкзНаПостав"] = df_zmm067_2022_2025["Позиция ЗкзНаПостав"].apply(temizle_ve_cevir)



In [18]:
#df_zmm067_2022_2025["Позиция ЗкзНаПостав"] = df_zmm067_2022_2025["Позиция ЗкзНаПостав"].apply(temizle_ve_cevir)


In [19]:
#df_zmm067_2022_2025["Дополнительное"].sample(n=5)

In [20]:
#df_zmm067_2022_2025.columns

In [21]:
df_me5a_2022_2025 = df_me5a_2022_2025.map(temizle_nan)
df_zmm059_2022_2025 = df_zmm059_2022_2025.map(temizle_nan)
df_me2n_2022_2025 = df_me2n_2022_2025.map(temizle_nan)
df_tedarikci_listesi = df_tedarikci_listesi.map(temizle_nan)
birlesik_df_zmb51 = birlesik_df_zmb51.map(temizle_nan)
df_zmm067_2022_2025 = df_zmm067_2022_2025.map(temizle_nan)

In [22]:
df_calisilan = df_zmm059_2022_2025.copy()

In [23]:
df_calisilan["B3-B3POZ"] = (
    df_calisilan["Заявка"].astype(str) + "_" + df_calisilan["Позиция заявки"].astype(str)
)
df_me5a_2022_2025["B3-B3POZ"] = (
    df_me5a_2022_2025["Заявка"].astype(str) + "_" + df_me5a_2022_2025["Позиция заявки"].astype(str)
)

In [24]:
df_calisilan.columns.values[2] = "Зп_Поз"
df_tedarikci_listesi.rename(columns={'kod': 'Поставщик'}, inplace=True)

In [25]:
adetler = df_calisilan["B3-B3POZ"].value_counts()

In [26]:
mukerrer_kodlar = adetler[adetler > 1].index

In [27]:
silinmesi_gerekenler = df_calisilan[
    (df_calisilan["B3-B3POZ"].isin(mukerrer_kodlar)) &
    (df_calisilan["Документ_закупки"].isna())

]

In [28]:
df_calisilan = df_calisilan.drop(silinmesi_gerekenler.index)

In [29]:
#df_calisilan["Поставщик"] = df_calisilan["Поставщик"].apply(temizle_ve_cevir)

In [30]:
# Tedarikçi sözlüğünü yine string anahtarlara göre oluştur
tedarikci_dict = dict(zip(df_tedarikci_listesi.iloc[:, 0].astype(str), df_tedarikci_listesi.iloc[:, 1]))

# Eşleştirme
df_calisilan["имя_поставщика"] = df_calisilan["Поставщик"].map(tedarikci_dict)

In [31]:
#df_calisilan.tail()

In [32]:
# Sözlük oluştur (anahtar: B3-B3POZ, değer: Материал)
b3_to_material_dict = dict(zip(df_me5a_2022_2025["B3-B3POZ"].astype(str), df_me5a_2022_2025["Материал"]))

In [33]:
# B3-B3POZ'e göre eşleşen Материал'ları getir (yeni bir sütun olarak)
df_calisilan["Материал_yeni"] = df_calisilan["B3-B3POZ"].astype(str).map(b3_to_material_dict)

In [34]:
# Sadece boş olan Материал hücrelerini, eşleşen değerle doldur
df_calisilan["Материал"] = df_calisilan["Материал"].fillna(df_calisilan["Материал_yeni"])
# Geçici sütunu silelim
df_calisilan.drop(columns=["Материал_yeni"], inplace=True)

In [35]:
# Sözlükleri oluştur
ru_dict = dict(zip(df_material_list.iloc[:, 0].astype(str), df_material_list.iloc[:, 1]))
tr_dict = dict(zip(df_material_list.iloc[:, 0].astype(str), df_material_list.iloc[:, 2]))

# Eşleştir
df_calisilan["RU Наименование"] = df_calisilan["Материал"].astype(str).map(ru_dict)
df_calisilan["TR Наименование"] = df_calisilan["Материал"].astype(str).map(tr_dict)


In [36]:
#df_calisilan["Материал"].isna().sum()

In [37]:
#df_calisilan[["Поставщик", "имя_поставщика"]].sample(n=5)

In [38]:
df_calisilan.drop(columns=['Материалы тур.', 'Материалы анг.'], inplace=True)

In [39]:
# Sütunları çıkart
col_ru = df_calisilan.pop('RU Наименование')
col_tr = df_calisilan.pop('TR Наименование')
col_b3 = df_calisilan.pop('B3-B3POZ')

# Sütunları istediğin yerlere ekle
df_calisilan.insert(1, 'B3-B3POZ', col_b3)
df_calisilan.insert(8, 'RU Наименование', col_ru)
df_calisilan.insert(9, 'TR Наименование', col_tr)


In [40]:
 # Sözlük oluştur (anahtar: B3-B3POZ, değer: Материал)
b3_to_material_dict = dict(zip(df_me5a_2022_2025["B3-B3POZ"].astype(str), df_me5a_2022_2025["Материал"]))

In [41]:
# B3-B3POZ'e göre eşleşen Материал'ları getir (yeni bir sütun olarak)
df_calisilan["Материал_yeni"] = df_calisilan["B3-B3POZ"].astype(str).map(b3_to_material_dict)

In [42]:
# Sadece boş olan Материал hücrelerini, eşleşen değerle doldur
df_calisilan["Материал"] = df_calisilan["Материал"].fillna(df_calisilan["Материал_yeni"])
# Geçici sütunu silelim
df_calisilan.drop(columns=["Материал_yeni"], inplace=True)

In [43]:
# Sözlükleri oluştur
ru_dict = dict(zip(df_material_list.iloc[:, 0].astype(str), df_material_list.iloc[:, 1]))
tr_dict = dict(zip(df_material_list.iloc[:, 0].astype(str), df_material_list.iloc[:, 2]))

# Eşleştir
df_calisilan["RU Наименование"] = df_calisilan["Материал"].astype(str).map(ru_dict)
df_calisilan["TR Наименование"] = df_calisilan["Материал"].astype(str).map(tr_dict)

In [44]:
df_calisilan["Материал"].isna().sum()

np.int64(5180)

In [45]:
df_calisilan = df_calisilan.map(temizle_nan)

In [46]:
sorted_columns = sorted(df_calisilan.columns)
print(sorted_columns)

['B3-B3POZ', 'RU Наименование', 'TR Наименование', 'Автор Внутреннего заказа', 'БЕ', 'Валюта', 'Валюта ЗП', 'Валюта.1', 'Валюта.2', 'Вид докум. закупки', 'Вид докум. закупки.1', 'ГОД', 'Группа закупок', 'Группа закупок.1', 'Группа материалов', 'Дата вступления в силу контракта', 'Дата доставки, одобренная Поставщиком', 'Дата контракта', 'Дата окончания действия договора', 'Дата поставки', 'Дата проводки', 'Дата создания', 'Дата создания.1', 'Документ_закупки', 'ЕИ заказа на постав.', 'Единица ЗП', 'Единица цены', 'Завод', 'Закуп. организация', 'Заявка', 'Значок "поставка завершена"', 'Зп_Поз', 'Имя 1', 'Инвентарный номер в SAS', 'Индикатор удаления', 'Итого цена нетто', 'Количество ЗП', 'Количество по счету', 'Количество по счету.1', 'Количество по счету.2', 'Количество поставки', 'Краткий текст', 'Материал', 'Минимальная цена ЗП', 'Минимальная цена ЗП.1', 'Минимальная цена ЗП.2', 'Название ГрЗакупок', 'Название ГрЗакупок.1', 'Название ЗакупОрг', 'Название группы', 'Название фирмы', 'Н

In [47]:
#df_calisilan[["Документ_закупки","Зп_Поз","Количество ЗП","Цена нетто ЗП","Итого цена нетто"]].sample(n=5, random_state=1)

In [48]:
# Hepsini string yap ve boşlukları temizle
birlesik_df_zmb51["Заказ на поставку"] = birlesik_df_zmb51["Заказ на поставку"].astype(str).str.strip()
df_me2n_2022_2025["Документ закупки"] = df_me2n_2022_2025["Документ закупки"].astype(str).str.strip()


In [49]:
# "Наш знак" için dict
dict_nash_znak = dict(zip(df_me2n_2022_2025["Документ закупки"], df_me2n_2022_2025["Наш знак"]))

# "Ваш код" için dict
dict_vash_kod = dict(zip(df_me2n_2022_2025["Документ закупки"], df_me2n_2022_2025["Ваш код"]))

# map ile ekleme
birlesik_df_zmb51["Наш знак"] = birlesik_df_zmb51["Заказ на поставку"].map(dict_nash_znak)
birlesik_df_zmb51["Ваш код"] = birlesik_df_zmb51["Заказ на поставку"].map(dict_vash_kod)

In [50]:
df_calisilan["Позиция заявки"].apply(temizle_ve_cevir)

Unnamed: 0,Позиция заявки
0,10
1,10
2,20
3,30
4,20
...,...
766587,
766588,
766589,
766590,


In [51]:
# 1. Anahtar sütunlarını birleştir ve zp_zppoz adını ver
birlesik_df_zmb51["zp_zppoz"] = (
    birlesik_df_zmb51["Заказ на поставку"].apply(temizle_ve_cevir) + "_" +
    birlesik_df_zmb51["Позиция"].apply(temizle_ve_cevir)
)

df_calisilan["zp_zppoz"] = (
    df_calisilan["Документ_закупки"].apply(temizle_ve_cevir) + "_" +
    df_calisilan["Зп_Поз"].apply(temizle_ve_cevir)
)

# 2. dict oluştur
dict_poz = dict(zip(df_calisilan["zp_zppoz"], df_calisilan["Позиция заявки"]))

# 3. map ile yeni sütunu ekle
birlesik_df_zmb51["Позиция заявки"] = birlesik_df_zmb51["zp_zppoz"].map(dict_poz)
birlesik_df_zmb51["Позиция заявки"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Позиция заявки"] = birlesik_df_zmb51["Позиция заявки"].fillna(0).astype(int)

  birlesik_df_zmb51["Позиция заявки"] = birlesik_df_zmb51["Позиция заявки"].fillna(0).astype(int)


In [52]:
# 1. Zorunlu temizleme işlemleri (orijinal sütunların üzerine yazar)
df_me5a_2022_2025["Заявка"] = df_me5a_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_me5a_2022_2025["Позиция заявки"] = df_me5a_2022_2025["Позиция заявки"].apply(temizle_ve_cevir)

df_zmm067_2022_2025["Заявка"] = df_zmm067_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_zmm067_2022_2025["Позиция заявки"] = df_zmm067_2022_2025["Позиция заявки"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur
df_me5a_2022_2025["zayavka_poz"] = df_me5a_2022_2025["Заявка"] + "_" + df_me5a_2022_2025["Позиция заявки"]
df_zmm067_2022_2025["zayavka_poz"] = df_zmm067_2022_2025["Заявка"] + "_" + df_zmm067_2022_2025["Позиция заявки"]

# 3. Dict oluştur
dict_dop = dict(zip(df_zmm067_2022_2025["zayavka_poz"], df_zmm067_2022_2025["Дополнительное"]))

# 4. map ile yeni sütun ekle
df_me5a_2022_2025["Дополнительное"] = df_me5a_2022_2025["zayavka_poz"].map(dict_dop)

#yeni oluşturulan sutunlara ihtiyaç kalmadı

df_me5a_2022_2025 = df_me5a_2022_2025.drop(columns=["zayavka_poz"])
df_zmm067_2022_2025 = df_zmm067_2022_2025.drop(columns=["zayavka_poz"])

In [53]:
# 1. Sütunları temizle (aynı sütunların üzerine yazıyoruz)
df_me2n_2022_2025["Документ закупки"] = df_me2n_2022_2025["Документ закупки"].apply(temizle_ve_cevir)
df_me2n_2022_2025["Позиция"] = df_me2n_2022_2025["Позиция"].apply(temizle_ve_cevir)

df_calisilan["Документ_закупки"] = df_calisilan["Документ_закупки"].apply(temizle_ve_cevir)
df_calisilan["Зп_Поз"] = df_calisilan["Зп_Поз"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur
df_me2n_2022_2025["doc_poz"] = df_me2n_2022_2025["Документ закупки"] + "_" + df_me2n_2022_2025["Позиция"]
df_calisilan["doc_poz"] = df_calisilan["Документ_закупки"] + "_" + df_calisilan["Зп_Поз"]

# 3. Dict oluştur (anahtar: doc_poz, değer: Создал)
dict_sozdal = dict(zip(df_calisilan["doc_poz"], df_calisilan["Создал"]))

# 4. map ile df_me2n'e ekle
df_me2n_2022_2025["Создал"] = df_me2n_2022_2025["doc_poz"].map(dict_sozdal)

# yeni oluşturulan sütunlara ihtiyaç kalmadı
df_me2n_2022_2025 = df_me2n_2022_2025.drop(columns=["doc_poz"])
df_calisilan = df_calisilan.drop(columns=["doc_poz"])

In [54]:
# 1. Temizleme işlemi
birlesik_df_zmb51["Поставщик"] = birlesik_df_zmb51["Поставщик"].apply(temizle_ve_cevir)
df_tedarikci_listesi["﻿Кредитор"] = df_tedarikci_listesi["﻿Кредитор"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur (tek sütun olduğu için direkt kullanabiliriz)
# 3. Dict oluştur
dict_suppliers = dict(zip(df_tedarikci_listesi["﻿Кредитор"], df_tedarikci_listesi["Имя поставщика"]))

# 4. map ile birlesik_df_zmb51'e ekle
birlesik_df_zmb51["Имя поставщика"] = birlesik_df_zmb51["Поставщик"].map(dict_suppliers)


In [55]:
# 1. Temizleme işlemi
birlesik_df_zmb51["Заказ на поставку"] = birlesik_df_zmb51["Заказ на поставку"].apply(temizle_ve_cevir)
birlesik_df_zmb51["Позиция"] = birlesik_df_zmb51["Позиция"].apply(temizle_ve_cevir)

df_me2n_2022_2025["Документ закупки"] = df_me2n_2022_2025["Документ закупки"].apply(temizle_ve_cevir)
df_me2n_2022_2025["Позиция"] = df_me2n_2022_2025["Позиция"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur
birlesik_df_zmb51["doc_poz"] = birlesik_df_zmb51["Заказ на поставку"] + "_" + birlesik_df_zmb51["Позиция"]
df_me2n_2022_2025["doc_poz"] = df_me2n_2022_2025["Документ закупки"] + "_" + df_me2n_2022_2025["Позиция"]

# 3. Dict oluştur (anahtar: doc_poz, değer: Объем заказа)
dict_obem = dict(zip(df_me2n_2022_2025["doc_poz"], df_me2n_2022_2025["Объем заказа"]))

# 4. map ile birlesik_df_zmb51'e ekle
birlesik_df_zmb51["Объем заказа"] = birlesik_df_zmb51["doc_poz"].map(dict_obem)
#yeni oluşturulan sutunlara ihtiyaç kalmadı
birlesik_df_zmb51 = birlesik_df_zmb51.drop(columns=["doc_poz"])
df_me2n_2022_2025 = df_me2n_2022_2025.drop(columns=["doc_poz"])



In [56]:
df_me2n_2022_2025["Объем заказа"] = pd.to_numeric(df_me2n_2022_2025["Объем заказа"], errors="coerce")
df_me2n_2022_2025["еще поставить (количество)"] = pd.to_numeric(
    df_me2n_2022_2025["еще поставить (количество)"].fillna(0), errors="coerce"
)

# 2. Hesaplama
df_me2n_2022_2025["Уже поставлено (количество)"] = (
    df_me2n_2022_2025["Объем заказа"] - df_me2n_2022_2025["еще поставить (количество)"]
)

In [57]:
# 1. Temizleme işlemi
df_me2n_2022_2025["Документ закупки"] = df_me2n_2022_2025["Документ закупки"].apply(temizle_ve_cevir)
df_me2n_2022_2025["Позиция"] = df_me2n_2022_2025["Позиция"].apply(temizle_ve_cevir)


df_calisilan["Документ_закупки"] = df_calisilan["Документ_закупки"].apply(temizle_ve_cevir)
df_calisilan["Зп_Поз"] = df_calisilan["Зп_Поз"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur
df_me2n_2022_2025["doc_poz"] = df_me2n_2022_2025["Документ закупки"] + "_" + df_me2n_2022_2025["Позиция"]
df_calisilan["doc_poz"] = df_calisilan["Документ_закупки"] + "_" + df_calisilan["Зп_Поз"]

# 3. Dict oluştur (anahtar: doc_poz, değer: Позиция заявки)
dict_poz = dict(zip(df_calisilan["doc_poz"], df_calisilan["Позиция заявки"]))

# 4. map ile df_me2n_2022_2025'e ekle
df_me2n_2022_2025["Позиция заявки"] = df_me2n_2022_2025["doc_poz"].map(dict_poz)
#yeni oluşturulan sutunlara ihtiyaç kalmadı
df_calisilan = df_calisilan.drop(columns=["doc_poz"])
df_me2n_2022_2025 = df_me2n_2022_2025.drop(columns=["doc_poz"])


In [58]:
df_me2n_2022_2025["Материал_ME2N"] = df_me2n_2022_2025["Материал"]
df_me5a_2022_2025["Материал_ME5A"] = df_me5a_2022_2025["Материал"]
# 1. Temizleme işlemi
df_me2n_2022_2025["Заявка"] = df_me2n_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_me2n_2022_2025["Позиция заявки"] = df_me2n_2022_2025["Позиция заявки"].apply(temizle_ve_cevir)

df_me5a_2022_2025["Заявка"] = df_me5a_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_me5a_2022_2025["Позиция заявки"] = df_me5a_2022_2025["Позиция заявки"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur
df_me2n_2022_2025["zayavka_poz"] = df_me2n_2022_2025["Заявка"] + "_" + df_me2n_2022_2025["Позиция заявки"]
df_me5a_2022_2025["zayavka_poz"] = df_me5a_2022_2025["Заявка"] + "_" + df_me5a_2022_2025["Позиция заявки"]

# 3. Dict oluştur (anahtar: zayavka_poz, değer: Материал_ME5A)
dict_me5a = dict(zip(df_me5a_2022_2025["zayavka_poz"], df_me5a_2022_2025["Материал_ME5A"]))

# 4. map ile df_me2n_2022_2025'e ekle
df_me2n_2022_2025["Материал_ME5A"] = df_me2n_2022_2025["zayavka_poz"].map(dict_me5a)
#yeni oluşturulan sutunlara ihtiyaç kalmadı
df_me5a_2022_2025 = df_me5a_2022_2025.drop(columns=["zayavka_poz"])
df_me2n_2022_2025 = df_me2n_2022_2025.drop(columns=["zayavka_poz"])


In [59]:
df_me2n_2022_2025 = df_me2n_2022_2025.applymap(temizle_nan)

  df_me2n_2022_2025 = df_me2n_2022_2025.applymap(temizle_nan)


In [60]:
df_me2n_2022_2025_analog = df_me2n_2022_2025[
    (df_me2n_2022_2025["Материал_ME2N"] != df_me2n_2022_2025["Материал_ME5A"]) &
    (df_me2n_2022_2025["Заявка"].apply(dolu_mi) & df_me2n_2022_2025["Позиция заявки"].apply(dolu_mi))
].copy()


In [61]:
# 1. Temizleme işlemi (gerekiyorsa)
df_me2n_2022_2025_analog["Материал_ME5A"] = df_me2n_2022_2025_analog["Материал_ME5A"].apply(temizle_ve_cevir)
df_material_list["﻿Материал"] = df_material_list["﻿Материал"].apply(temizle_ve_cevir)

# 2. Dict oluştur
dict_tr = dict(zip(df_material_list["﻿Материал"], df_material_list["TR Наименование"]))
dict_ru = dict(zip(df_material_list["﻿Материал"], df_material_list["RU Наименование"]))

# 3. map ile yeni sütunları ekle
df_me2n_2022_2025_analog["TR Наименование_ВЗ"] = df_me2n_2022_2025_analog["Материал_ME5A"].map(dict_tr)
df_me2n_2022_2025_analog["RU Наименование_ВЗ"] = df_me2n_2022_2025_analog["Материал_ME5A"].map(dict_ru)


In [62]:
df_me2n_2022_2025_analog = df_me2n_2022_2025_analog.rename(columns={"Наименование RU": "Наименование RU_ЗП"})
df_me2n_2022_2025_analog = df_me2n_2022_2025_analog.rename(columns={"Наименование TR": "Наименование TR_ЗП"})


In [63]:
# 1. Anahtar sütunları tuple haline getirelim
df_me2n_2022_2025["key"] = df_me2n_2022_2025[["Документ закупки", "Позиция"]].apply(tuple, axis=1)
df_me5a_2022_2025["key"] = df_me5a_2022_2025[["Заказ на поставку", "Позиция ЗкзНаПостав"]].apply(tuple, axis=1)

# 2. Aktarılacak sütunlar ve hedef adları
map_dict = {
    "Объем заказа": "Объем заказа",
    "еще поставить (количество)": "еще поставить (количество)",
    "Еще для поставки (стоимость)": "Еще для поставки (стоимость)",
    "Для фактурирования (колич.)": "Для фактурирования (колич.)",
    "Для фактурирования (стоим.)": "Для фактурирования (стоим.)",
    "Имя поставщика": "Имя поставщика",
    "Создал": "ЗП_Создал",
    "Наш знак":"Наш знак",
    "Цена нетто":"Цена нетто",
    "Валюта":"Валюта",
    "Индикатор удаления":"Индикатор удаления_зп",
    "ЕИ заказа на постав.":"ЕИ заказа на постав.",
    "Единица цены":"Единица цены",

}

# 3. Her sütun için dict map uygulama
for source_col, target_col in map_dict.items():
    temp_dict = dict(zip(df_me2n_2022_2025["key"], df_me2n_2022_2025[source_col]))
    df_me5a_2022_2025[target_col] = df_me5a_2022_2025["key"].map(temp_dict)

# 4. Geçici key sütunlarını kaldır
df_me2n_2022_2025.drop(columns=["key"], inplace=True)
df_me5a_2022_2025.drop(columns=["key"], inplace=True)


In [64]:
# 1. Yeni sütun sırasını belirle
df_me2n_2022_2025_analog_yeni_sira = [
    'ГОД', 'Документ закупки', 'Позиция', 'Группа закупок',
    'Закуп. организация','Создал', 'Индикатор удаления', 'Дата документа',
    'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка',  'Позиция заявки',
    'Материал_ME2N','Материал_ME5A','Наименование RU_ЗП','Наименование TR_ЗП',
    'RU Наименование_ВЗ','TR Наименование_ВЗ',
    'Объем заказа', 'еще поставить (количество)','Уже поставлено (количество)',
    'Складская ЕИ','Количество в СЕИ','Единица цены','Цена нетто',
    'СтоимЗаказа нетто','Еще для поставки (стоимость)','Валюта',
    'Вид докум. закупки','Код налога','Дата поставки','ЕИ заказа на постав.',
    'Инвентарный номер'
]

# 2. DataFrame'i yeni sütun sırasına göre düzenle
df_me2n_2022_2025_analog =df_me2n_2022_2025_analog[df_me2n_2022_2025_analog_yeni_sira]


In [65]:
# 1. Yeni sütun sırasını belirle
df_me2n_2022_2025_yeni_sira = [
      'ГОД', 'Документ закупки', 'Позиция','Создал', 'Группа закупок',
      'Закуп. организация', 'Индикатор удаления', 'Дата документа',
      'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка','Позиция заявки',
      'Материал','Инвентарный номер', 'Наименование RU','Наименование TR',
      'Объем заказа','Складская ЕИ','еще поставить (количество)',
      'Еще для поставки (стоимость)','Уже поставлено (количество)',
      'Для фактурирования (стоим.)','Для фактурирования (колич.)',
      'Количество в СЕИ', 'Единица цены','СтоимЗаказа нетто','Валюта',
      'Цена нетто','Вид докум. закупки', 'Код налога','Краткий текст',
      'Дата поставки', 'ЕИ заказа на постав.','ТипДокумЗакупки',
      'Тип неполноты данных','Группа материалов','Материал_ME2N', 'Материал_ME5A'

]

# 2. DataFrame'i yeni sütun sırasına göre düzenle
df_me2n_2022_2025 =df_me2n_2022_2025[df_me2n_2022_2025_yeni_sira]

In [66]:
df_me5a_2022_2025.rename(columns={"'Дата заявки": "Дата_заявки"}, inplace=True)


In [67]:
df_me5a_2022_2025_yeni_sira = [
       'ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3','ЗатребованКолич',
       'Объем заказа',  'Заказ на поставку', 'Позиция ЗкзНаПостав','Индикатор удаления_зп',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения','Дата заказа', 'Долгосрочный договор',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование',  'Дополнительное','Инвентарный номер', 'Краткий текст',
       'Закуп. организация','еще поставить (количество)','Еще для поставки (стоимость)',
       'Для фактурирования (колич.)','Для фактурирования (стоим.)', 'Имя поставщика',
       'ЗП_Создал','Наш знак', 'Цена нетто', 'Валюта', 'ЕИ заказа на постав.',
       'Единица цены', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования', 'Дата_заявки', 'B3-B3POZ','Материал_ME5A'

]

# 2. DataFrame'i yeni sütun sırasına göre düzenle
df_me5a_2022_2025 =df_me5a_2022_2025[df_me5a_2022_2025_yeni_sira]

In [68]:
df_calisilan_yeni_sira = [
    'ГОД','zp_zppoz','B3-B3POZ','Документ_закупки', 'Зп_Поз',
    'Индикатор удаления','неполн.', 'Материал', 'Заявка', 'Позиция заявки',
    'RU Наименование', 'TR Наименование',
    'Инвентарный номер в SAS', 'Количество ЗП',
    'Минимальная цена ЗП', 'Минимальная цена ЗП.1',
    'Минимальная цена ЗП.2','Единица ЗП', 'Цена нетто ЗП', 'Итого цена нетто',
    'Валюта ЗП','Вид докум. закупки', 'Дата создания', 'Дата поставки',
    'Дата доставки, одобренная Поставщиком', 'Группа закупок',
    'Название ГрЗакупок', 'БЕ', 'Название фирмы', 'Закуп. организация',
    'Название ЗакупОрг', 'Завод', 'Имя 1', 'Поставщик', 'Группа материалов',
    'Название группы', 'Краткий текст', 'Создал', 'Вид докум. закупки.1',
    'Обозначение ВидДокум', 'Дата создания.1', 'Создал.1','Группа закупок.1',
    'Название ГрЗакупок.1', 'ЕИ заказа на постав.','Единица цены',
    'Цена заказа нетто', 'Стоимость брутто', 'Валюта','Недопоставленное количество',
    'Количество поставки', 'Сумма брутто','Валюта.1', 'Количество по счету', 'Дата проводки',
    'Количество по счету.1', 'Валюта.2', 'Остаток количества по счету',
    'Остаток суммы по счету', 'Автор Внутреннего заказа', 'Количество по счету.2',
    'Значок "поставка завершена"','Дата контракта', 'Дата вступления в силу контракта',
    'Дата окончания действия договора', 'Склад', '№ комиссии','имя_поставщика'
]

# 2. DataFrame'i yeni sütun sırasına göre düzenle
df_calisilan =df_calisilan[df_calisilan_yeni_sira]

In [69]:
# 1. Yeni sütun sırasını belirle
zmb51_yeni_sira = [
    'ГОД', 'Вид движения', 'Партия', 'Материал', 'Заказ на поставку',
    'Позиция', 'Наш знак', 'Ваш код', 'Внутренний заказ', 'Позиция заявки',
    'Склад', 'Дата ввода', 'Время ввода', 'Дата документа', 'Дата проводки',
    'Документ материала', 'Поз. док. материала', 'Признак 2', 'Ссылка',
    'Краткий текст материала', 'Кол-во в ЕИ ввода', 'Объем заказа',
    'ЕИ ввода','Сумма во ВВ', 'Количество', 'Поставщик','Имя поставщика',
    'Накладная','Текст заголовка документа', 'Заявитель', 'Инвентарный номер',
    'Имя пользователя', 'БЕ', 'Базовая ЕИ', 'ГодДокумМатериала', 'Валюта',
    'Завод', 'Имя 1', 'Основное средство', 'ЕИ цены заказа','ЕИ заказа на постав.'

]

# 2. DataFrame'i yeni sütun sırasına göre düzenle
birlesik_df_zmb51 = birlesik_df_zmb51[zmb51_yeni_sira]

In [70]:
#ME5A
df_me5a_2022_2025["ГОД"] = pd.to_numeric(df_me5a_2022_2025["ГОД"], errors="coerce").astype("Int64")
df_me5a_2022_2025["Заявка"] = pd.to_numeric(df_me5a_2022_2025["Заявка"], errors="coerce").astype("Int64")
df_me5a_2022_2025["Материал"] = pd.to_numeric(df_me5a_2022_2025["Материал"], errors="coerce").astype("Int64")
df_me5a_2022_2025["Заказ на поставку"] = pd.to_numeric(df_me5a_2022_2025["Заказ на поставку"], errors="coerce").astype("Int64")
df_me5a_2022_2025["Позиция ЗкзНаПостав"] = pd.to_numeric(df_me5a_2022_2025["Позиция ЗкзНаПостав"], errors="coerce").astype("Int64")
df_me5a_2022_2025["ЗатребованКолич"] = pd.to_numeric(df_me5a_2022_2025["ЗатребованКолич"], errors="coerce").astype("float64")
df_me5a_2022_2025["Заказанное к-во"] = pd.to_numeric(df_me5a_2022_2025["Заказанное к-во"], errors="coerce").astype("float64")
df_me5a_2022_2025["Объем заказа"] = pd.to_numeric(df_me5a_2022_2025["Объем заказа"], errors="coerce").astype("float64")
df_me5a_2022_2025["еще поставить (количество)"] = pd.to_numeric(df_me5a_2022_2025["еще поставить (количество)"], errors="coerce").astype("float64")
df_me5a_2022_2025["Еще для поставки (стоимость)"] = pd.to_numeric(df_me5a_2022_2025["Еще для поставки (стоимость)"], errors="coerce").astype("float64")
df_me5a_2022_2025["Для фактурирования (колич.)"] = pd.to_numeric(df_me5a_2022_2025["Для фактурирования (колич.)"], errors="coerce").astype("float64")
df_me5a_2022_2025["Для фактурирования (стоим.)"] = pd.to_numeric(df_me5a_2022_2025["Для фактурирования (стоим.)"], errors="coerce").astype("float64")
#ME2N
df_me2n_2022_2025["ГОД"] = pd.to_numeric(df_me2n_2022_2025["ГОД"], errors="coerce").astype("Int64")
df_me2n_2022_2025["Документ закупки"] = pd.to_numeric(df_me2n_2022_2025["Документ закупки"], errors="coerce").astype("Int64")
df_me2n_2022_2025["Позиция"] = pd.to_numeric(df_me2n_2022_2025["Позиция"], errors="coerce").astype("Int64")
df_me2n_2022_2025["Заявка"] = pd.to_numeric(df_me2n_2022_2025["Заявка"], errors="coerce").astype("Int64")
df_me2n_2022_2025["Материал"] = pd.to_numeric(df_me2n_2022_2025["Материал"], errors="coerce").astype("Int64")
df_me2n_2022_2025["Объем заказа"] = pd.to_numeric(df_me2n_2022_2025["Объем заказа"], errors="coerce").astype("float64")
df_me2n_2022_2025["еще поставить (количество)"] = pd.to_numeric(df_me2n_2022_2025["еще поставить (количество)"], errors="coerce").astype("float64")
df_me2n_2022_2025["Уже поставлено (количество)"] = pd.to_numeric(df_me2n_2022_2025["Уже поставлено (количество)"], errors="coerce").astype("float64")
df_me2n_2022_2025["Для фактурирования (стоим.)"] = pd.to_numeric(df_me2n_2022_2025["Для фактурирования (стоим.)"], errors="coerce").astype("float64")
df_me2n_2022_2025["Для фактурирования (колич.)"] = pd.to_numeric(df_me2n_2022_2025["Для фактурирования (колич.)"], errors="coerce").astype("float64")
df_me2n_2022_2025["Количество в СЕИ"] = pd.to_numeric(df_me2n_2022_2025["Количество в СЕИ"], errors="coerce").astype("float64")
df_me2n_2022_2025["Цена нетто"] = pd.to_numeric(df_me2n_2022_2025["Цена нетто"], errors="coerce").astype("float64")
df_me2n_2022_2025["СтоимЗаказа нетто"] = pd.to_numeric(df_me2n_2022_2025["СтоимЗаказа нетто"], errors="coerce").astype("float64")
df_me2n_2022_2025["Еще для поставки (стоимость)"] = pd.to_numeric(df_me2n_2022_2025["Еще для поставки (стоимость)"], errors="coerce").astype("float64")
#zmb51
birlesik_df_zmb51["ГОД"] = pd.to_numeric(birlesik_df_zmb51["ГОД"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Партия"] = pd.to_numeric(birlesik_df_zmb51["Партия"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Заказ на поставку"] = pd.to_numeric(birlesik_df_zmb51["Заказ на поставку"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Позиция"] = pd.to_numeric(birlesik_df_zmb51["Позиция"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Внутренний заказ"] = pd.to_numeric(birlesik_df_zmb51["Внутренний заказ"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Документ материала"] = pd.to_numeric(birlesik_df_zmb51["Документ материала"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Поз. док. материала"] = pd.to_numeric(birlesik_df_zmb51["Поз. док. материала"], errors="coerce").astype("Int64")
birlesik_df_zmb51["Кол-во в ЕИ ввода"] = pd.to_numeric(birlesik_df_zmb51["Кол-во в ЕИ ввода"], errors="coerce").astype("float64")
birlesik_df_zmb51["Сумма во ВВ"] = pd.to_numeric(birlesik_df_zmb51["Сумма во ВВ"], errors="coerce").astype("float64")
birlesik_df_zmb51["Количество"] = pd.to_numeric(birlesik_df_zmb51["Количество"], errors="coerce").astype("float64")
birlesik_df_zmb51["Поставщик"] = pd.to_numeric(birlesik_df_zmb51["Поставщик"], errors="coerce").astype("Int64")
#zmm059
df_calisilan["ГОД"] = pd.to_numeric(df_calisilan["ГОД"], errors="coerce").astype("Int64")
df_calisilan["Документ_закупки"] = pd.to_numeric(df_calisilan["Документ_закупки"], errors="coerce").astype("Int64")
df_calisilan["Зп_Поз"] = pd.to_numeric(df_calisilan["Зп_Поз"], errors="coerce").astype("Int64")
df_calisilan["Материал"] = pd.to_numeric(df_calisilan["Материал"], errors="coerce").astype("Int64")
df_calisilan["Заявка"] = pd.to_numeric(df_calisilan["Заявка"], errors="coerce").astype("Int64")
df_calisilan["Позиция заявки"] = pd.to_numeric(df_calisilan["Позиция заявки"], errors="coerce").astype("Int64")
df_calisilan["Количество ЗП"] = pd.to_numeric(df_calisilan["Количество ЗП"], errors="coerce").astype("float64")
df_calisilan["Минимальная цена ЗП"] = pd.to_numeric(df_calisilan["Минимальная цена ЗП"], errors="coerce").astype("float64")
df_calisilan["Минимальная цена ЗП.1"] = pd.to_numeric(df_calisilan["Минимальная цена ЗП.1"], errors="coerce").astype("float64")
df_calisilan["Единица ЗП"] = pd.to_numeric(df_calisilan["Единица ЗП"], errors="coerce").astype("Int64")
df_calisilan["Цена нетто ЗП"] = pd.to_numeric(df_calisilan["Цена нетто ЗП"], errors="coerce").astype("float64")
df_calisilan["Итого цена нетто"] = pd.to_numeric(df_calisilan["Итого цена нетто"], errors="coerce").astype("float64")
df_calisilan["Поставщик"] = pd.to_numeric(df_calisilan["Поставщик"], errors="coerce").astype("Int64")
#me2n_analog
df_me2n_2022_2025_analog["ГОД"] = pd.to_numeric(df_me2n_2022_2025["ГОД"], errors="coerce").astype("Int64")
df_me2n_2022_2025_analog["Документ закупки"] = pd.to_numeric(df_me2n_2022_2025["Документ закупки"], errors="coerce").astype("Int64")
df_me2n_2022_2025_analog["Заявка"] = pd.to_numeric(df_me2n_2022_2025["Заявка"], errors="coerce").astype("Int64")
df_me2n_2022_2025_analog["Материал"] = pd.to_numeric(df_me2n_2022_2025["Материал"], errors="coerce").astype("Int64")
df_me2n_2022_2025_analog["Объем заказа"] = pd.to_numeric(df_me2n_2022_2025["Объем заказа"], errors="coerce").astype("float64")
df_me2n_2022_2025_analog["еще поставить (количество)"] = pd.to_numeric(df_me2n_2022_2025["еще поставить (количество)"], errors="coerce").astype("float64")
df_me2n_2022_2025_analog["Количество в СЕИ"] = pd.to_numeric(df_me2n_2022_2025["Количество в СЕИ"], errors="coerce").astype("float64")
df_me2n_2022_2025_analog["Цена нетто"] = pd.to_numeric(df_me2n_2022_2025["Цена нетто"], errors="coerce").astype("float64")
df_me2n_2022_2025_analog["СтоимЗаказа нетто"] = pd.to_numeric(df_me2n_2022_2025["СтоимЗаказа нетто"], errors="coerce").astype("float64")
df_me2n_2022_2025_analog["Еще для поставки (стоимость)"] = pd.to_numeric(df_me2n_2022_2025["Еще для поставки (стоимость)"], errors="coerce").astype("float64")

#zmm067
df_zmm067_2022_2025.rename(columns={"SAT Yaratma Tarihi": "Дата Заявка"}, inplace=True)
df_zmm067_2022_2025.rename(columns={"Sipariş Silme Göstergesi": "Индикатор удаления заказа"}, inplace=True)
df_zmm067_2022_2025.rename(columns={"SAT Teslimat Tarihi": "Дата доставки заявка"}, inplace=True)
df_zmm067_2022_2025.rename(columns={"Talep Silme Göstergesi": "Индикатор удаления заявка"}, inplace=True)
df_zmm067_2022_2025["Объем заказа"] = pd.to_numeric(df_zmm067_2022_2025["Объем заказа"], errors="coerce").astype("float64")

In [71]:
df_calisilan_cleaned =df_calisilan.copy()

In [72]:
df_me5a_cleaned.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
       'Дата заказа', 'Долгосрочный договор', 'ЗатребованКолич',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование', 'Инвентарный номер', 'Краткий текст',
       'Закуп. организация', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования', ''Дата заявки'],
      dtype='object')

In [73]:
df_me5a_cleaned = df_me5a_cleaned[~df_me5a_cleaned["Индикатор удаления_B3"]]

In [74]:
# sadece NaN olanları tutar; boş string ('') varsa bu satırlar silinebilir
df_calisilan_cleaned = df_calisilan_cleaned[df_calisilan_cleaned['Индикатор удаления'].isna()]


In [75]:
df_calisilan_cleaned['Индикатор удаления']

Unnamed: 0,Индикатор удаления
0,
1,
2,
3,
4,
...,...
766587,
766588,
766589,
766590,


In [76]:
df_calisilan_cleaned.columns


Index(['ГОД', 'zp_zppoz', 'B3-B3POZ', 'Документ_закупки', 'Зп_Поз',
       'Индикатор удаления', 'неполн.', 'Материал', 'Заявка', 'Позиция заявки',
       'RU Наименование', 'TR Наименование', 'Инвентарный номер в SAS',
       'Количество ЗП', 'Минимальная цена ЗП', 'Минимальная цена ЗП.1',
       'Минимальная цена ЗП.2', 'Единица ЗП', 'Цена нетто ЗП',
       'Итого цена нетто', 'Валюта ЗП', 'Вид докум. закупки', 'Дата создания',
       'Дата поставки', 'Дата доставки, одобренная Поставщиком',
       'Группа закупок', 'Название ГрЗакупок', 'БЕ', 'Название фирмы',
       'Закуп. организация', 'Название ЗакупОрг', 'Завод', 'Имя 1',
       'Поставщик', 'Группа материалов', 'Название группы', 'Краткий текст',
       'Создал', 'Вид докум. закупки.1', 'Обозначение ВидДокум',
       'Дата создания.1', 'Создал.1', 'Группа закупок.1',
       'Название ГрЗакупок.1', 'ЕИ заказа на постав.', 'Единица цены',
       'Цена заказа нетто', 'Стоимость брутто', 'Валюта',
       'Недопоставленное количест

In [77]:
df_me5a_cleaned.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
       'Дата заказа', 'Долгосрочный договор', 'ЗатребованКолич',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование', 'Инвентарный номер', 'Краткий текст',
       'Закуп. организация', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования', ''Дата заявки'],
      dtype='object')

In [78]:
df_me5a_cleaned.loc[:, 'zp_zppoz'] = (
    df_me5a_cleaned['Заказ на поставку'].astype(str) + '_' +
    df_me5a_cleaned['Позиция ЗкзНаПостав'].astype(str)
)

In [79]:
df_me5a_cleaned.loc[:, 'B3-POZ'] = (
    df_me5a_cleaned['Заявка'].astype(str) + '_' +
    df_me5a_cleaned['Позиция заявки'].astype(str)
)

In [80]:
df_me5a_cleaned.loc[df_me5a_cleaned['Заказ на поставку'].notna(), 'Заказ на поставку'] = pd.NA
df_me5a_cleaned.loc[df_me5a_cleaned['Позиция ЗкзНаПостав'].notna(), 'Позиция ЗкзНаПостав'] = pd.NA

In [81]:
df_me5a_cleaned['ЗатребованКолич']

Unnamed: 0,ЗатребованКолич
0,90
1,90
2,90
3,370
4,2445
...,...
393752,2
393753,2
393754,30
393755,30


In [82]:
df_me5a_cleaned.loc[:, "Заказанное к-во"] = pd.to_numeric(
    df_me5a_cleaned["Заказанное к-во"], errors="coerce"
).astype("float64")

In [83]:
df_me5a_cleaned.loc[:, "ЗатребованКолич"] = pd.to_numeric(
    df_me5a_cleaned["ЗатребованКолич"], errors="coerce"
).astype("float64")

In [84]:
df_me5a_cleaned.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
       'Дата заказа', 'Долгосрочный договор', 'ЗатребованКолич',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование', 'Инвентарный номер', 'Краткий текст',
       'Закуп. организация', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования', ''Дата заявки', 'zp_zppoz', 'B3-POZ'],
      dtype='object')

In [85]:
df_calisilan_cleaned.columns

Index(['ГОД', 'zp_zppoz', 'B3-B3POZ', 'Документ_закупки', 'Зп_Поз',
       'Индикатор удаления', 'неполн.', 'Материал', 'Заявка', 'Позиция заявки',
       'RU Наименование', 'TR Наименование', 'Инвентарный номер в SAS',
       'Количество ЗП', 'Минимальная цена ЗП', 'Минимальная цена ЗП.1',
       'Минимальная цена ЗП.2', 'Единица ЗП', 'Цена нетто ЗП',
       'Итого цена нетто', 'Валюта ЗП', 'Вид докум. закупки', 'Дата создания',
       'Дата поставки', 'Дата доставки, одобренная Поставщиком',
       'Группа закупок', 'Название ГрЗакупок', 'БЕ', 'Название фирмы',
       'Закуп. организация', 'Название ЗакупОрг', 'Завод', 'Имя 1',
       'Поставщик', 'Группа материалов', 'Название группы', 'Краткий текст',
       'Создал', 'Вид докум. закупки.1', 'Обозначение ВидДокум',
       'Дата создания.1', 'Создал.1', 'Группа закупок.1',
       'Название ГрЗакупок.1', 'ЕИ заказа на постав.', 'Единица цены',
       'Цена заказа нетто', 'Стоимость брутто', 'Валюта',
       'Недопоставленное количест

In [86]:
# 1️⃣ Önce df_calisilan_cleaned'deki anahtarları benzersiz hale getiriyoruz
df_calisilan_unique = df_calisilan_cleaned.drop_duplicates(subset='B3-B3POZ')

# 2️⃣ Merge işlemini yapıyoruz (her iki sütunu da ekliyoruz)
df_me5a_cleaned = df_me5a_cleaned.merge(
    df_calisilan_unique[['B3-B3POZ', 'Документ_закупки', 'Зп_Поз']],
    left_on='B3-POZ',
    right_on='B3-B3POZ',
    how='left'
)

# 3️⃣ Dolularını kendi sütunlarına yazıyoruz
df_me5a_cleaned['Заказ на поставку'] = df_me5a_cleaned['Документ_закупки'].combine_first(
    df_me5a_cleaned['Заказ на поставку']
)
df_me5a_cleaned['Позиция ЗкзНаПостав'] = df_me5a_cleaned['Зп_Поз'].combine_first(
    df_me5a_cleaned['Позиция ЗкзНаПостав']
)

# 4️⃣ Geçici sütunları güvenli şekilde sil
cols_to_drop = [col for col in ['Документ_закупки', 'Зп_Поз', 'B3-B3POZ'] if col in df_me5a_cleaned.columns]
df_me5a_cleaned.drop(columns=cols_to_drop, inplace=True)


In [87]:
df_me5a_cleaned.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
       'Дата заказа', 'Долгосрочный договор', 'ЗатребованКолич',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование', 'Инвентарный номер', 'Краткий текст',
       'Закуп. организация', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования', ''Дата заявки', 'zp_zppoz', 'B3-POZ'],
      dtype='object')

In [88]:
df_me5a_cleaned['silme_durumu'] = np.where(
    df_me5a_cleaned['Заказанное к-во'].isna(),  # Eğer boşsa
    'dursun',
    np.where(
        df_me5a_cleaned['Заказанное к-во'] < df_me5a_cleaned['ЗатребованКолич'],
        'dursun',
        'sil'
    )
)

In [89]:
print(df_me5a_cleaned['silme_durumu'].value_counts())

silme_durumu
sil       274788
dursun     87815
Name: count, dtype: int64


In [90]:
df_me5a_cleaned.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'Затребовал', 'Индик. выдачи', 'Группа деблокир.',
       'Статус обработки заявки', 'Дата заявки', 'Группа закупок',
       'Дата изменения', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
       'Дата заказа', 'Долгосрочный договор', 'ЗатребованКолич',
       'Заказанное к-во', 'Единица измерения', 'RU Наименование',
       'TR Наименование', 'Инвентарный номер', 'Краткий текст',
       'Закуп. организация', 'Создал', 'ПоступлМатериала', 'Поступление счета',
       'Номер проекта', 'Группа материалов', 'Дата поставки',
       'Завод-поставщик', 'Вид документа', 'Статус обработки',
       'Индикатор создания', 'Стратегия деблокир.', 'НДП-материал',
       'Номер потребности', 'Объем дефицита', 'Тип даты поставки',
       'Дата деблокирования', ''Дата заявки', 'zp_zppoz', 'B3-POZ',
       'silme_durumu'],
      dtype='object')

In [91]:
df_me5a_cleaned = df_me5a_cleaned.drop(
    df_me5a_cleaned[
        df_me5a_cleaned['Заказ на поставку'].notna() &
        (df_me5a_cleaned['silme_durumu'] == 'sil')
    ].index
)

In [92]:
print(df_me5a_cleaned['Заказ на поставку'].value_counts())

Заказ на поставку
3100010337    260
3100004384    119
3100004876    103
3100011876     76
3100011264     54
             ... 
3100000931      1
3100000743      1
3100000665      1
3100011841      1
3100000321      1
Name: count, Length: 1086, dtype: int64


In [93]:
for col in ["Заказ на поставку", "Позиция ЗкзНаПостав"]:
    # Boş değerleri koru, dolu olanları integer yap
    df_me5a_cleaned[col] = df_me5a_cleaned[col].apply(
        lambda x: pd.NA if pd.isna(x) else int(x) if float(x).is_integer() else float(x)
    ).astype("Int64")  # nullable integer dtype

In [94]:
df_me5a_cleaned[['Заявка','Позиция заявки','Заказ на поставку','Заказанное к-во','ЗатребованКолич']].sample(n=5)

Unnamed: 0,Заявка,Позиция заявки,Заказ на поставку,Заказанное к-во,ЗатребованКолич
131717,2200010834,4810,,0.0,1.0
3218,9900005156,1480,,0.0,1.0
13447,2200016701,170,,82.0,82.0
100172,2100003229,120,,0.0,1000.0
57367,9900003594,4250,,0.0,1.0


In [95]:
# 1. Zorunlu temizleme işlemleri (orijinal sütunların üzerine yazar)
df_me5a_cleaned["Заявка"] = df_me5a_cleaned["Заявка"].apply(temizle_ve_cevir)
df_me5a_cleaned["Позиция заявки"] = df_me5a_cleaned["Позиция заявки"].apply(temizle_ve_cevir)

df_zmm067_2022_2025["Заявка"] = df_zmm067_2022_2025["Заявка"].apply(temizle_ve_cevir)
df_zmm067_2022_2025["Позиция заявки"] = df_zmm067_2022_2025["Позиция заявки"].apply(temizle_ve_cevir)

# 2. Anahtar oluştur
df_me5a_cleaned["zayavka_poz"] = df_me5a_cleaned["Заявка"] + "_" + df_me5a_cleaned["Позиция заявки"]
df_zmm067_2022_2025["zayavka_poz"] = df_zmm067_2022_2025["Заявка"] + "_" + df_zmm067_2022_2025["Позиция заявки"]

# 3. Dict oluştur
dict_dop = dict(zip(df_zmm067_2022_2025["zayavka_poz"], df_zmm067_2022_2025["Дополнительное"]))

# 4. map ile yeni sütun ekle
df_me5a_cleaned["Дополнительное"] = df_me5a_cleaned["zayavka_poz"].map(dict_dop)

#yeni oluşturulan sutunlara ihtiyaç kalmadı

df_me5a_cleaned = df_me5a_cleaned.drop(columns=["zayavka_poz"])
df_zmm067_2022_2025 = df_zmm067_2022_2025.drop(columns=["zayavka_poz"])

In [96]:
df_me2n_2022_2025.sample(n=5)

Unnamed: 0,ГОД,Документ закупки,Позиция,Создал,Группа закупок,Закуп. организация,Индикатор удаления,Дата документа,Наш знак,Ваш код,...,Вид докум. закупки,Код налога,Краткий текст,Дата поставки,ЕИ заказа на постав.,ТипДокумЗакупки,Тип неполноты данных,Группа материалов,Материал_ME2N,Материал_ME5A
26087,2025,3100014410,230,MAKIF,1,2991,,2025-11-11,БЕТОН,AKKUYUTST25,...,ZSUP,TP,ŞERBET ENJEKSİYON,2025-02-27,М3,F,Документ полностью сохранен,MZ-2068,4500475101,4500475101.0
244691,2024,3100006977,5670,ACHARYEV,100,2992,,2024-03-12,SP06,AKEM331,...,ZSUP,VB,22/225 .0120.10UKC.KPJ.TM.TB0112 М40-1,2024-04-25,КГ,F,Документ полностью сохранен,MZ-2065,4500363915,4500363915.0
6186,2026,3100015030,1180,,100,2992,,2026-01-26,5.1a part 4,FT04231034,...,ZSUP,VB,S-5.1a4_Pi-2_12UQC.PEB.TW.TB0002,2026-03-02,КГ,F,Документ полностью сохранен,MZ-2065,4500524147,
63373,2025,3100013102,180,ILUKIANCHUK,1,2991,,2025-05-16,90VFA2025,90VFA2025,...,ZSUP,VB,SP0902.OK3-4-CTS00000681.24,2025-06-28,ШТ,F,Документ полностью сохранен,MZ-2065,4500491169,4500491169.0
240662,2024,3100007077,440,VKUZMICHEV,1,2991,,2024-03-20,AKC745,AKC745,...,ZSUP,VB,AKU.0120.00USY.0.KM.LC0028 LB2-92,2024-03-02,ШТ,F,Документ полностью сохранен,MZ-2065,4500304235,4500304235.0


In [97]:
"""
del df_old_me2n
del old_employee
del df_old_me2n_filtered
del df_filtered2
"""

'\ndel df_old_me2n\ndel old_employee\ndel df_old_me2n_filtered\ndel df_filtered2\n'

In [98]:
df_old_me2n=df_me2n_2022_2025.copy()

In [99]:
df_old_me2n.columns

Index(['ГОД', 'Документ закупки', 'Позиция', 'Создал', 'Группа закупок',
       'Закуп. организация', 'Индикатор удаления', 'Дата документа',
       'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка', 'Позиция заявки',
       'Материал', 'Инвентарный номер', 'Наименование RU', 'Наименование TR',
       'Объем заказа', 'Складская ЕИ', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Уже поставлено (количество)',
       'Для фактурирования (стоим.)', 'Для фактурирования (колич.)',
       'Количество в СЕИ', 'Единица цены', 'СтоимЗаказа нетто', 'Валюта',
       'Цена нетто', 'Вид докум. закупки', 'Код налога', 'Краткий текст',
       'Дата поставки', 'ЕИ заказа на постав.', 'ТипДокумЗакупки',
       'Тип неполноты данных', 'Группа материалов', 'Материал_ME2N',
       'Материал_ME5A'],
      dtype='object')

In [100]:
df_old_me2n['Создал'].unique()

array([<NA>, 'HALLAKOV', 'SISIGUZEL', 'MAKIF', 'MCIMAN', 'ACHARYEV',
       'RKUCUK', 'NBEREZOVSKAY', 'FSALIMOV', 'ZIZZET', 'ILUKIANCHUK',
       'EKOC', 'NOZKAN', 'TEGOROVA', 'KGAIVUK', 'FPINAR', 'SSTRIAPUKHIN',
       'APOTAPOV', 'DKILIC', 'ZDURMAZ', 'VKUZMICHEV', 'MSAHIN', 'ESAVRAN',
       'IBATENKO', 'ETROFIMUSHK', 'ISVIRID', 'ESAMSONOVA', 'SOZEVIN',
       'NARIKAN', 'IKALASHNIKOV', 'ZHUSEYNOVA', 'RGAVRIKOVA', 'ARTGALIEV',
       'ILAMBIN', 'NOMAROVA', 'SZHELAMSKII', 'NBULUT', 'ESIKORSKAIA',
       'IKOVALEV', 'MCHEREMNYKH', 'NZYBINSSKAYA', 'SUSLU', 'OSKREBETS',
       'MPETROVA', 'TZADOROZHN', 'SBASTANOV', 'MZHAGIPAROV', 'IABBASOVA',
       'MCETIN', 'KLITVINOVA', 'SYILDIRIM', 'GCEREZCI', 'NKANYSBAY',
       'ACOSKUN', 'RDAVLETBAKOV', 'OLUGOVIK', 'YOZTURK', 'FANNAKULIEVA',
       'IMURADIAN', 'TMISHATKINA', 'GTORAMAN', 'MOZCAN', 'RKAYNAR',
       'EUSLU', 'VSOYBIR', 'OKOKOGLU', 'VPIROG', 'MLEBEDEV',
       'ZABDUVAKHAP', 'ESARAL', 'SMANAFOVA', 'TURMANOV', 'EMILAEVA',
       'AMA

In [101]:
"""
old_employee =['TURMANOV','ILAMBIN','IKALASHNIKOV','MOZCAN','ZHUSEYNOVA','ESIKORSKAIA','FANNAKULIEVA',
               'EUSLU','RALIOGLU','GTORAMAN','YOZTURK','GCEREZCI','MMAMAZHANOV','ESARAL','KDUVERLIOGLU',
               'AMARIA','MPETROVA','NKANYSBAY','ACOSKUN','RKAYNAR','EMILAEVA',
               'DPANTEEV','EYILDIZ','VSOYBIR','DSHARKOV','CCANBULAT','VPIROG',
               'TDZHURAEV','TMISHATKINA','MMOROZOV','MMURADOV'
              ]
              """

"\nold_employee =['TURMANOV','ILAMBIN','IKALASHNIKOV','MOZCAN','ZHUSEYNOVA','ESIKORSKAIA','FANNAKULIEVA',\n               'EUSLU','RALIOGLU','GTORAMAN','YOZTURK','GCEREZCI','MMAMAZHANOV','ESARAL','KDUVERLIOGLU',\n               'AMARIA','MPETROVA','NKANYSBAY','ACOSKUN','RKAYNAR','EMILAEVA',\n               'DPANTEEV','EYILDIZ','VSOYBIR','DSHARKOV','CCANBULAT','VPIROG',\n               'TDZHURAEV','TMISHATKINA','MMOROZOV','MMURADOV'\n              ]\n              "

In [102]:
old_employee =['NBEREZOVSKAY', 'NOZKAN', 'DKILIC', 'ESAVRAN', 'HALLAKOV',
       'ACHARYEV', 'MCIMAN', 'APOTAPOV', 'TEGOROVA', 'EKOC', 'IBATENKO',
       'ZIZZET', 'SISIGUZEL', 'FPINAR', 'KGAIVUK', 'MAKIF', 'MSAHIN',
       'FSALIMOV', 'SSTRIAPUKHIN', 'VKUZMICHEV', 'ETROFIMUSHK',
       'ILUKIANCHUK', 'ZDURMAZ', 'ISVIRID', 'ESAMSONOVA', 'SOZEVIN',
       'NARIKAN', 'IKALASHNIKOV', 'ZHUSEYNOVA', 'RGAVRIKOVA', 'ARTGALIEV',
       'ILAMBIN', 'NOMAROVA', 'SZHELAMSKII', 'NBULUT', 'ESIKORSKAIA',
       'IKOVALEV', 'MCHEREMNYKH', 'NZYBINSSKAYA', 'SUSLU', 'OSKREBETS',
       'TZADOROZHN', 'MPETROVA', 'SBASTANOV', 'MZHAGIPAROV', 'IABBASOVA',
       'MCETIN', 'KLITVINOVA', 'SYILDIRIM', 'GCEREZCI', 'NKANYSBAY',
       'ACOSKUN', 'RDAVLETBAKOV', 'OLUGOVIK', 'YOZTURK', 'FANNAKULIEVA',
       'TMISHATKINA', 'IMURADIAN', 'GTORAMAN', 'MOZCAN', 'RKAYNAR',
       'EUSLU', 'VSOYBIR', 'OKOKOGLU', 'VPIROG', 'MLEBEDEV',
       'ZABDUVAKHAP', 'ESARAL', 'SMANAFOVA', 'TURMANOV', 'EMILAEVA',
       'AMARIA', 'AISAKINA', 'ACHERKASOV', 'CCANBULAT', 'EYILDIZ',
       'MANDREEV', 'EPULATOV', 'MMOROZOV', 'MMAMAZHANOV', 'KDUVERLIOGLU',
       'TDZHURAEV', 'NTUAEVA', 'TAPARINA', 'IKUCUKKAVRUK', 'DSHARKOV',
       'AEIGOSHEV', 'IZEMLIAKOVA', 'MMURADOV', 'MBURMAKOVA', 'SBAKHITOV',
       'EGASIMOV', 'SURMANTSEVA', 'AEROKHOV', 'NHASANLI', 'MVOLKOVA',
       'RMAMMADOV', 'LUFITSEVA', 'IISMAILOV', 'EKHUDIAKOVA',
       'FMUSTAFAZADE', 'RALIOGLU', 'DPANTEEV', 'ZBONDAREVA'
              ]

In [103]:
df_old_me2n = df_old_me2n[df_old_me2n['Создал'].isin(old_employee)]

In [104]:
df_old_me2n.columns

Index(['ГОД', 'Документ закупки', 'Позиция', 'Создал', 'Группа закупок',
       'Закуп. организация', 'Индикатор удаления', 'Дата документа',
       'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка', 'Позиция заявки',
       'Материал', 'Инвентарный номер', 'Наименование RU', 'Наименование TR',
       'Объем заказа', 'Складская ЕИ', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Уже поставлено (количество)',
       'Для фактурирования (стоим.)', 'Для фактурирования (колич.)',
       'Количество в СЕИ', 'Единица цены', 'СтоимЗаказа нетто', 'Валюта',
       'Цена нетто', 'Вид докум. закупки', 'Код налога', 'Краткий текст',
       'Дата поставки', 'ЕИ заказа на постав.', 'ТипДокумЗакупки',
       'Тип неполноты данных', 'Группа материалов', 'Материал_ME2N',
       'Материал_ME5A'],
      dtype='object')

In [105]:
df_old_me2n['Индикатор удаления'].nunique()

2

In [106]:
df_old_me2n=df_old_me2n[(df_old_me2n['Еще для поставки (стоимость)']>0) & (df_old_me2n['Индикатор удаления'].isna())]

In [107]:
df_old_me2n['Индикатор удаления'].nunique()

0

In [108]:
# Gruplama için kullanılacak sütunlar
group_cols = ['Документ закупки']
# Aggregation (toplama/birleştirme) fonksiyonları
agg_funcs = {

    'Создал':'first',
    'Группа закупок':'first' ,
    'Закуп. организация':'first',
    'Дата документа':'first',
    'Наш знак':'first'   ,
    'Ваш код':'first',
    'Имя поставщика':'first',
    'СтоимЗаказа нетто':'sum',
    'Еще для поставки (стоимость)':'sum',
    'Валюта':'first'
}

# Gruplama ve aggregation işlemini gerçekleştiriyoruz
df_old_me2n_filtered = df_old_me2n.groupby(group_cols, as_index=False).agg(agg_funcs)

# The filtering for 'Индикатор удаления' was already performed on df_old_me2n
df_old_me2n_filtered=df_old_me2n_filtered[df_old_me2n_filtered['Еще для поставки (стоимость)']>0]

In [109]:
df_old_me2n_filtered = df_old_me2n_filtered.drop(columns=['Имя поставщика'])

In [110]:
df_old_me2n_filtered.columns

Index(['Документ закупки', 'Создал', 'Группа закупок', 'Закуп. организация',
       'Дата документа', 'Наш знак', 'Ваш код', 'СтоимЗаказа нетто',
       'Еще для поставки (стоимость)', 'Валюта'],
      dtype='object')

In [111]:
df_calisilan['Поставщик']

Unnamed: 0,Поставщик
0,
1,
2,
3,
4,
...,...
766587,1000019187
766588,1000019187
766589,1000019187
766590,1000001070


In [112]:
df_calisilan.columns

Index(['ГОД', 'zp_zppoz', 'B3-B3POZ', 'Документ_закупки', 'Зп_Поз',
       'Индикатор удаления', 'неполн.', 'Материал', 'Заявка', 'Позиция заявки',
       'RU Наименование', 'TR Наименование', 'Инвентарный номер в SAS',
       'Количество ЗП', 'Минимальная цена ЗП', 'Минимальная цена ЗП.1',
       'Минимальная цена ЗП.2', 'Единица ЗП', 'Цена нетто ЗП',
       'Итого цена нетто', 'Валюта ЗП', 'Вид докум. закупки', 'Дата создания',
       'Дата поставки', 'Дата доставки, одобренная Поставщиком',
       'Группа закупок', 'Название ГрЗакупок', 'БЕ', 'Название фирмы',
       'Закуп. организация', 'Название ЗакупОрг', 'Завод', 'Имя 1',
       'Поставщик', 'Группа материалов', 'Название группы', 'Краткий текст',
       'Создал', 'Вид докум. закупки.1', 'Обозначение ВидДокум',
       'Дата создания.1', 'Создал.1', 'Группа закупок.1',
       'Название ГрЗакупок.1', 'ЕИ заказа на постав.', 'Единица цены',
       'Цена заказа нетто', 'Стоимость брутто', 'Валюта',
       'Недопоставленное количест

In [113]:
# 1. Anahtar sütunları tuple haline getirelim
df_calisilan["key"] = df_calisilan[["Документ_закупки"]].apply(tuple, axis=1)
df_old_me2n_filtered["key"] = df_old_me2n_filtered[["Документ закупки"]].apply(tuple, axis=1)

# 2. Aktarılacak sütunlar ve hedef adları
map_dict_B3_status = {
    "имя_поставщика":"имя_поставщика",
    "Поставщик":"Номер Поставщика SAP"
}

# 3. Her sütun için dict map uygulama
for source_col, target_col in map_dict_B3_status.items():
    temp_dict = dict(zip(df_calisilan["key"], df_calisilan[source_col]))
    df_old_me2n_filtered[target_col] = df_old_me2n_filtered["key"].map(temp_dict)

# 4. Geçici key sütunlarını kaldır
df_old_me2n_filtered.drop(columns=["key"], inplace=True)
df_calisilan.drop(columns=["key"], inplace=True)

In [114]:
df_old_me2n_filtered.sample(n=5)

Unnamed: 0,Документ закупки,Создал,Группа закупок,Закуп. организация,Дата документа,Наш знак,Ваш код,СтоимЗаказа нетто,Еще для поставки (стоимость),Валюта,имя_поставщика,Номер Поставщика SAP
234,3100002716,IKALASHNIKOV,116,2991,2023-06-21,AK-C-597,AK-C-597,188240.0,188240.0,RUB,КОМПЛЕКСНЫЙ ТЕРМИНАЛ ООО,1000001462
663,3100004824,ACHARYEV,100,2992,2023-11-09,AKEM306,AKEM306,1763.89,1755.03,TRY,ENKA CİVATA İMALAT VE SAN.MAM.,1000000795
404,3100003613,GTORAMAN,107,2991,2023-08-29,AK-C-680,AK-C-680,343369.89,265584.6,USD,AKKUYUTST ENDÜSTRİYEL ÜRETİM İNŞAAT,2950
6,3100000048,FANNAKULIEVA,105,2991,2022-11-30,AK-NP-784,AK-NP-784,218.28,218.28,USD,ŞEYHMUS ORAL-ORASEL HIRDAVAT,1000017133
1049,3100006882,FANNAKULIEVA,105,2991,2024-03-07,AK-NP-2607,AK-NP-2607,52280.0,52280.0,EUR,SARFPLUS YAPI İNŞAAT MAZL. LTD.ŞTİ,1000001563


In [115]:
#her bir kuratörü tek tek kaydetme
# 1. Gerekli sütun sırasını tanımla
columns_order = [
    'Создал','Группа закупок','Документ закупки','Закуп. организация','Дата документа','Наш знак','Ваш код','имя_поставщика','Номер Поставщика SAP','СтоимЗаказа нетто','Еще для поставки (стоимость)','Валюта'
]

# 2. Benzersiz Заявитель değerlerini al
employees = df_old_me2n_filtered['Создал'].dropna().unique()

# 3. Çıktıları kaydetmek için klasör oluştur (varsa geç)
os.makedirs("not_delivered", exist_ok=True)

# 4. Her Заявитель için döngü
for z_name in employees:
    # Dosya adı için geçersiz karakterleri temizle
    safe_name = "".join(c if c.isalnum() or c in "._-" else "_" for c in z_name)

    # Filtreleme ve sütun sıralama
    df_filtered2 = df_old_me2n_filtered[df_old_me2n_filtered['Создал'] == z_name].copy()

    # Sütun kontrolü: eksik olanları atla (varsa uyarı verir)
    missing_cols = [col for col in columns_order if col not in df_filtered2.columns]
    if missing_cols:
        print(f"{z_name} için eksik sütun(lar): {missing_cols}")
        continue

    df_filtered2 = df_filtered2[columns_order]

    # Excel olarak kaydet
    output_path = f"not_delivered/me2n_notdelivered_{safe_name}.xlsx"
    df_filtered2.to_excel(output_path, index=False)

print("✅ Tüm dosyalar 'not_delivered/' klasörüne kaydedildi.")

✅ Tüm dosyalar 'not_delivered/' klasörüne kaydedildi.


In [116]:
zip_filename = "not_delivered_me2n_all.zip"

with zipfile.ZipFile(zip_filename, 'w', zipfile.ZIP_DEFLATED) as zipf:
    for root, dirs, files in os.walk("not_delivered"):
        for file in files:
            if file.endswith(".xlsx"):
                file_path = os.path.join(root, file)
                zipf.write(file_path)

In [117]:
from google.colab import files
files.download(zip_filename)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [118]:
#sadece geliştirme aşamasında kullanılacak !
"""
del zmb51_dummy
del df_B3_status
del zmm059_dummy
del me2n_dummy
del zpp001_dummy

"""

'\ndel zmb51_dummy\ndel df_B3_status\ndel zmm059_dummy\ndel me2n_dummy\ndel zpp001_dummy\n\n'

In [119]:
df_B3_status=df_me5a_2022_2025.copy()
zmb51_dummy=birlesik_df_zmb51.copy()
zmm059_dummy=df_calisilan.copy()
me2n_dummy=df_me2n_2022_2025.copy()
zpp001_dummy=zpp001.copy()

In [120]:
zmb51_dummy.columns

Index(['ГОД', 'Вид движения', 'Партия', 'Материал', 'Заказ на поставку',
       'Позиция', 'Наш знак', 'Ваш код', 'Внутренний заказ', 'Позиция заявки',
       'Склад', 'Дата ввода', 'Время ввода', 'Дата документа', 'Дата проводки',
       'Документ материала', 'Поз. док. материала', 'Признак 2', 'Ссылка',
       'Краткий текст материала', 'Кол-во в ЕИ ввода', 'Объем заказа',
       'ЕИ ввода', 'Сумма во ВВ', 'Количество', 'Поставщик', 'Имя поставщика',
       'Накладная', 'Текст заголовка документа', 'Заявитель',
       'Инвентарный номер', 'Имя пользователя', 'БЕ', 'Базовая ЕИ',
       'ГодДокумМатериала', 'Валюта', 'Завод', 'Имя 1', 'Основное средство',
       'ЕИ цены заказа', 'ЕИ заказа на постав.'],
      dtype='object')

In [121]:
display(zmb51_dummy[(zmb51_dummy["Заказ на поставку"]==3100005467) & (zmb51_dummy["Позиция"]==80)][["Кол-во в ЕИ ввода", "Сумма во ВВ", "Наш знак"]])

Unnamed: 0,Кол-во в ЕИ ввода,Сумма во ВВ,Наш знак
292436,1.0,14511.18,AK-C-389


In [122]:
#zmb51_dummy = duzenle_sayi_sutunu(zmb51_dummy, "Кол-во в ЕИ ввода")

In [123]:
zmb51_dummy['Признак 2&кол-во&ЕИ']=zmb51_dummy['Признак 2'].astype(str)+' '+zmb51_dummy['Кол-во в ЕИ ввода'].astype(str)+' '+zmb51_dummy['ЕИ ввода'].astype(str)
zmb51_dummy['Ссылка&кол-во&ЕИ']=zmb51_dummy['Ссылка'].astype(str)+' '+zmb51_dummy['Кол-во в ЕИ ввода'].astype(str)+' '+zmb51_dummy['ЕИ ввода'].astype(str)
zmb51_dummy["Кол-во в ЕИ ввода"] = pd.to_numeric(zmb51_dummy["Кол-во в ЕИ ввода"], errors="coerce").astype("float64")


In [124]:
zmb51_dummy.columns

Index(['ГОД', 'Вид движения', 'Партия', 'Материал', 'Заказ на поставку',
       'Позиция', 'Наш знак', 'Ваш код', 'Внутренний заказ', 'Позиция заявки',
       'Склад', 'Дата ввода', 'Время ввода', 'Дата документа', 'Дата проводки',
       'Документ материала', 'Поз. док. материала', 'Признак 2', 'Ссылка',
       'Краткий текст материала', 'Кол-во в ЕИ ввода', 'Объем заказа',
       'ЕИ ввода', 'Сумма во ВВ', 'Количество', 'Поставщик', 'Имя поставщика',
       'Накладная', 'Текст заголовка документа', 'Заявитель',
       'Инвентарный номер', 'Имя пользователя', 'БЕ', 'Базовая ЕИ',
       'ГодДокумМатериала', 'Валюта', 'Завод', 'Имя 1', 'Основное средство',
       'ЕИ цены заказа', 'ЕИ заказа на постав.', 'Признак 2&кол-во&ЕИ',
       'Ссылка&кол-во&ЕИ'],
      dtype='object')

In [125]:
# Gruplama için kullanılacak sütunlar
group_cols = ['Заказ на поставку', 'Позиция']
# Aggregation (toplama/birleştirme) fonksiyonları
agg_funcs = {
    'Кол-во в ЕИ ввода': 'sum', # 'Кол-во в ЕИ ввода' sütunundaki değerleri topluyoruz
    'Дата проводки': lambda x: ';'.join(x.dropna().astype(str)),
    # 'Дата проводки' sütununu 'YYYY-MM-DD' formatında stringe çevirip,
    # benzersiz değerleri alıp ';' ile birleştiriyoruz. NaN değerler dışarıda bırakılır.
    'Признак 2&кол-во&ЕИ': lambda x: ';'.join(x.dropna().astype(str)),
    # 'накладная&кол-во&ЕИ 1' sütunundaki benzersiz string değerleri ';' ile birleştiriyoruz. NaN değerler dışarıda bırakılır.
    'Ссылка&кол-во&ЕИ': lambda x: ';'.join(x.dropna().astype(str))
    # 'накладная&кол-во&ЕИ 2' sütunundaki benzersiz string değerleri ';' ile birleştiriyoruz. NaN değerler dışarıda bırakılır.
}

# Gruplama ve aggregation işlemini gerçekleştiriyoruz
result_df = zmb51_dummy.groupby(group_cols, as_index=False).agg(agg_funcs)
del zmb51_dummy
zmb51_dummy=result_df.copy()
del result_df

In [126]:
zmb51_dummy["Заказ на поставку"] = zmb51_dummy["Заказ на поставку"].apply(temizle_ve_cevir)
zmb51_dummy["Позиция"] = zmb51_dummy["Позиция"].apply(temizle_ve_cevir)
me2n_dummy["Документ закупки"] = me2n_dummy["Документ закупки"].apply(temizle_ve_cevir)
me2n_dummy["Позиция"] = me2n_dummy["Позиция"].apply(temizle_ve_cevir)

In [127]:
me2n_dummy.columns

Index(['ГОД', 'Документ закупки', 'Позиция', 'Создал', 'Группа закупок',
       'Закуп. организация', 'Индикатор удаления', 'Дата документа',
       'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка', 'Позиция заявки',
       'Материал', 'Инвентарный номер', 'Наименование RU', 'Наименование TR',
       'Объем заказа', 'Складская ЕИ', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Уже поставлено (количество)',
       'Для фактурирования (стоим.)', 'Для фактурирования (колич.)',
       'Количество в СЕИ', 'Единица цены', 'СтоимЗаказа нетто', 'Валюта',
       'Цена нетто', 'Вид докум. закупки', 'Код налога', 'Краткий текст',
       'Дата поставки', 'ЕИ заказа на постав.', 'ТипДокумЗакупки',
       'Тип неполноты данных', 'Группа материалов', 'Материал_ME2N',
       'Материал_ME5A'],
      dtype='object')

In [128]:
# 1. Anahtar sütunları tuple haline getirelim
me2n_dummy["key"] = me2n_dummy[["Документ закупки", "Позиция"]].apply(tuple, axis=1)
zmb51_dummy["key"] = zmb51_dummy[["Заказ на поставку", "Позиция"]].apply(tuple, axis=1)

# 2. Aktarılacak sütunlar ve hedef adları
map_dict_B3_status = {
    "Кол-во в ЕИ ввода": "Кол-во в ЕИ ввода",
    "Дата проводки":"Дата проводки",
    "Признак 2&кол-во&ЕИ":"Признак 2&кол-во&ЕИ",
    "Ссылка&кол-во&ЕИ":"Ссылка&кол-во&ЕИ",


}

# 3. Her sütun için dict map uygulama
for source_col, target_col in map_dict_B3_status.items():
    temp_dict = dict(zip(zmb51_dummy["key"], zmb51_dummy[source_col]))
    me2n_dummy[target_col] = me2n_dummy["key"].map(temp_dict)

# 4. Geçici key sütunlarını kaldır
zmb51_dummy.drop(columns=["key"], inplace=True)
me2n_dummy.drop(columns=["key"], inplace=True)

In [129]:
zmm059_dummy["Документ_закупки"] = zmm059_dummy["Документ_закупки"].apply(temizle_ve_cevir)
zmm059_dummy["Зп_Поз"] = zmm059_dummy["Зп_Поз"].apply(temizle_ve_cevir)
me2n_dummy["Документ закупки"] = me2n_dummy["Документ закупки"].apply(temizle_ve_cevir)
me2n_dummy["Позиция"] = me2n_dummy["Позиция"].apply(temizle_ve_cevir)

In [130]:
# 1. Anahtar sütunları tuple haline getirelim
me2n_dummy["key"] = me2n_dummy[["Документ закупки", "Позиция"]].apply(tuple, axis=1)
zmm059_dummy["key"] = zmm059_dummy[["Документ_закупки", "Зп_Поз"]].apply(tuple, axis=1)

# 2. Aktarılacak sütunlar ve hedef adları
map_dict_56 = {
    'Группа закупок':'Группа закупок_me2n',
    'Закуп. организация':'Закуп. организация_me2n',
    'Наш знак':'Наш знак_me2n',
    'Ваш код':'Ваш код_me2n',
    'Объем заказа':'Объем заказа_me2n',
    'Материал':'Материал_me2n',
    "Складская ЕИ":"Складская ЕИ_me2n",
    "ЕИ заказа на постав.":"ЕИ заказа на постав._me2n",
    "Кол-во в ЕИ ввода": "Кол-во в ЕИ ввода",
    "Дата проводки":"Дата проводки_me2n",
    "Признак 2&кол-во&ЕИ":"Признак 2&кол-во&ЕИ",
    "Ссылка&кол-во&ЕИ":"Ссылка&кол-во&ЕИ",



}

# 3. Her sütun için dict map uygulama
for source_col, target_col in map_dict_56.items():
    temp_dict = dict(zip(me2n_dummy["key"], me2n_dummy[source_col]))
    zmm059_dummy[target_col] = zmm059_dummy["key"].map(temp_dict)

# 4. Geçici key sütunlarını kaldır
zmm059_dummy.drop(columns=["key"], inplace=True)
me2n_dummy.drop(columns=["key"], inplace=True)

In [131]:
zmm059_dummy["Закуп. организация_me2n"]=zmm059_dummy["Закуп. организация_me2n"].apply(temizle_ve_cevir)

In [132]:
zmm059_dummy.loc[zmm059_dummy["Индикатор удаления"].notna(), "Объем заказа_me2n"] = pd.NA

In [133]:
zmm059_dummy.loc[zmm059_dummy["Индикатор удаления"].notna(), "Индикатор удаления"] = zmm059_dummy["Индикатор удаления"]+"_"+zmm059_dummy["Документ_закупки"]+"-"+zmm059_dummy["Зп_Поз"]

In [134]:
zmm059_dummy[["Индикатор удаления","Объем заказа_me2n"]].sample(n=5 , random_state=42)

Unnamed: 0,Индикатор удаления,Объем заказа_me2n
501314,,
607988,,1.0
618437,,32.4
55590,,
748160,,


In [135]:
zmm059_dummy.columns

Index(['ГОД', 'zp_zppoz', 'B3-B3POZ', 'Документ_закупки', 'Зп_Поз',
       'Индикатор удаления', 'неполн.', 'Материал', 'Заявка', 'Позиция заявки',
       'RU Наименование', 'TR Наименование', 'Инвентарный номер в SAS',
       'Количество ЗП', 'Минимальная цена ЗП', 'Минимальная цена ЗП.1',
       'Минимальная цена ЗП.2', 'Единица ЗП', 'Цена нетто ЗП',
       'Итого цена нетто', 'Валюта ЗП', 'Вид докум. закупки', 'Дата создания',
       'Дата поставки', 'Дата доставки, одобренная Поставщиком',
       'Группа закупок', 'Название ГрЗакупок', 'БЕ', 'Название фирмы',
       'Закуп. организация', 'Название ЗакупОрг', 'Завод', 'Имя 1',
       'Поставщик', 'Группа материалов', 'Название группы', 'Краткий текст',
       'Создал', 'Вид докум. закупки.1', 'Обозначение ВидДокум',
       'Дата создания.1', 'Создал.1', 'Группа закупок.1',
       'Название ГрЗакупок.1', 'ЕИ заказа на постав.', 'Единица цены',
       'Цена заказа нетто', 'Стоимость брутто', 'Валюта',
       'Недопоставленное количест

In [136]:
# Gruplama için kullanılacak sütunlar
group_cols = ['Заявка', 'Позиция заявки']
# Aggregation (toplama/birleştirme) fonksiyonları
agg_funcs = {

    'Документ_закупки': lambda x: ';'.join(x.dropna().astype(str)),
    'Зп_Поз': lambda x : ';'.join(x.dropna().astype(str)),
    'Индикатор удаления': lambda x : ';'.join(x.dropna().astype(str)),
    'имя_поставщика': lambda x : ';'.join(x.dropna().astype(str)),
    'Группа закупок_me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'Закуп. организация_me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'Наш знак_me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'Ваш код_me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'Объем заказа_me2n': 'sum',
    'Материал_me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'Складская ЕИ_me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'ЕИ заказа на постав._me2n': lambda x : ';'.join(x.dropna().astype(str)),
    'Кол-во в ЕИ ввода': 'sum',
    'Признак 2&кол-во&ЕИ': lambda x : ';'.join(x.dropna().astype(str)),
    'Ссылка&кол-во&ЕИ': lambda x : ';'.join(x.dropna().astype(str)),
    'Дата проводки_me2n': lambda x : ';'.join(x.dropna().astype(str))
}

# Gruplama ve aggregation işlemini gerçekleştiriyoruz
result_df = zmm059_dummy.groupby(group_cols, as_index=False).agg(agg_funcs)
del zmm059_dummy
zmm059_dummy=result_df.copy()
del result_df

In [137]:
zmm059_dummy["Заявка"] = zmm059_dummy["Заявка"].apply(temizle_ve_cevir)
zmm059_dummy["Позиция заявки"] = zmm059_dummy["Позиция заявки"].apply(temizle_ve_cevir)
df_B3_status["Заявка"] = df_B3_status["Заявка"].apply(temizle_ve_cevir)
df_B3_status["Позиция заявки"] = df_B3_status["Позиция заявки"].apply(temizle_ve_cevir)

In [138]:
df_B3_status=df_B3_status.drop(columns=['Объем заказа','Имя поставщика',
                                        'Наш знак', 'Цена нетто', 'Валюта', 'ЕИ заказа на постав.',
                                        'Единица цены', 'Заказ на поставку', 'Позиция ЗкзНаПостав',
                                        'Индикатор удаления_зп','Индик. выдачи','Статус обработки заявки',
                                        'Дата изменения', 'Дата заказа','Долгосрочный договор','Закуп. организация','Создал',
                                        'ПоступлМатериала', 'Поступление счета', 'Номер проекта',
                                        'Дата поставки', 'Завод-поставщик','Вид документа', 'Статус обработки', 'Индикатор создания',
                                        'Стратегия деблокир.', 'НДП-материал', 'Номер потребности',
                                        'Объем дефицита', 'Тип даты поставки', 'Дата деблокирования','B3-B3POZ'

                                        ])

In [139]:
# 1. Anahtar sütunları tuple haline getirelim
df_B3_status["key"] = df_B3_status[["Заявка", "Позиция заявки"]].apply(tuple, axis=1)
zmm059_dummy["key"] = zmm059_dummy[["Заявка", "Позиция заявки"]].apply(tuple, axis=1)

# 2. Aktarılacak sütunlar ve hedef adları
map_dict_B3_status = {
    "Документ_закупки":"Документ_закупки",
    "Зп_Поз":"Зп_Поз",
    "Индикатор удаления":"Индикатор удаления",
    "имя_поставщика":"имя_поставщика",
    "Группа закупок_me2n":"Группа закупок_me2n",
    "Закуп. организация_me2n":"Закуп. организация_me2n",
    "Наш знак_me2n":"Наш знак_me2n",
    "Ваш код_me2n":"Ваш код_me2n",
    "Объем заказа_me2n":"Объем заказа_me2n",
    "Материал_me2n":"Материал_me2n",
    "Складская ЕИ_me2n":"Складская ЕИ_me2n",
    "ЕИ заказа на постав._me2n":"ЕИ заказа на постав._me2n",
    "Кол-во в ЕИ ввода":"Кол-во в ЕИ ввода",
    "Дата проводки_me2n":"Дата проводки",
    "Признак 2&кол-во&ЕИ":"Признак 2&кол-во&ЕИ",
    "Ссылка&кол-во&ЕИ":"Ссылка&кол-во&ЕИ",

}

# 3. Her sütun için dict map uygulama
for source_col, target_col in map_dict_B3_status.items():
    temp_dict = dict(zip(zmm059_dummy["key"], zmm059_dummy[source_col]))
    df_B3_status[target_col] = df_B3_status["key"].map(temp_dict)

# 4. Geçici key sütunlarını kaldır
zmm059_dummy.drop(columns=["key"], inplace=True)
df_B3_status.drop(columns=["key"], inplace=True)

In [140]:
df_B3_status.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'ЗатребованКолич', 'Затребовал', 'Группа деблокир.', 'Дата заявки',
       'Группа закупок', 'Заказанное к-во', 'Единица измерения',
       'RU Наименование', 'TR Наименование', 'Дополнительное',
       'Инвентарный номер', 'Краткий текст', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Для фактурирования (колич.)',
       'Для фактурирования (стоим.)', 'ЗП_Создал', 'Группа материалов',
       'Дата_заявки', 'Материал_ME5A', 'Документ_закупки', 'Зп_Поз',
       'Индикатор удаления', 'имя_поставщика', 'Группа закупок_me2n',
       'Закуп. организация_me2n', 'Наш знак_me2n', 'Ваш код_me2n',
       'Объем заказа_me2n', 'Материал_me2n', 'Складская ЕИ_me2n',
       'ЕИ заказа на постав._me2n', 'Кол-во в ЕИ ввода', 'Дата проводки',
       'Признак 2&кол-во&ЕИ', 'Ссылка&кол-во&ЕИ'],
      dtype='object')

In [141]:
df_B3_status["Закуп. организация_me2n"].sample(n=5)

Unnamed: 0,Закуп. организация_me2n
108244,
93156,2992
189669,2992;2992
139016,2992
265415,2992


In [142]:
df_B3_status.columns

Index(['ГОД', 'Заявка', 'Позиция заявки', 'Материал', 'Индикатор удаления_B3',
       'ЗатребованКолич', 'Затребовал', 'Группа деблокир.', 'Дата заявки',
       'Группа закупок', 'Заказанное к-во', 'Единица измерения',
       'RU Наименование', 'TR Наименование', 'Дополнительное',
       'Инвентарный номер', 'Краткий текст', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Для фактурирования (колич.)',
       'Для фактурирования (стоим.)', 'ЗП_Создал', 'Группа материалов',
       'Дата_заявки', 'Материал_ME5A', 'Документ_закупки', 'Зп_Поз',
       'Индикатор удаления', 'имя_поставщика', 'Группа закупок_me2n',
       'Закуп. организация_me2n', 'Наш знак_me2n', 'Ваш код_me2n',
       'Объем заказа_me2n', 'Материал_me2n', 'Складская ЕИ_me2n',
       'ЕИ заказа на постав._me2n', 'Кол-во в ЕИ ввода', 'Дата проводки',
       'Признак 2&кол-во&ЕИ', 'Ссылка&кол-во&ЕИ'],
      dtype='object')

In [143]:
display(df_B3_status[(df_B3_status["Заявка"]=="2200006369") & (df_B3_status["Позиция заявки"]=="5320")][["Кол-во в ЕИ ввода"]])

Unnamed: 0,Кол-во в ЕИ ввода
299417,4.0


In [144]:
df_B3_status[["Документ_закупки","Зп_Поз"]].sample(n=5)

Unnamed: 0,Документ_закупки,Зп_Поз
80320,3100011254.0,41370.0
354942,3100006271.0,940.0
103656,,
150239,3100008736.0,310.0
291275,3100005351.0,320.0


In [145]:
zpp001_dummy['Purpose Code'].sample(n=5)

Unnamed: 0,Purpose Code
1824,PIMMAS/MMR
8253,Металлоконструкции
4824,грунтовка на основе ПВА
3067,Поставка технических газов
3792,"Перемычка ПГС, Флажок"


In [146]:
zpp001_dummy.columns

Index(['﻿Валюта оплаты', 'Номер заявки на платеж', 'Тип транзакции',
       'Тип документа', 'Тип платежа', 'Статья ДДС', 'Наименование',
       'Purpose Code', 'Протокол', 'Номер договора', 'Инвойс', 'Кредитор',
       'Название кредитора', 'Оплачиваемая сумма', 'Валюта', 'Автор изменения',
       'Дата изменения', 'Создал', 'Дата создания', 'Unnamed: 19',
       'Статус согласующего', 'Оплаченная Сумма', 'Unnamed: 22', 'Дебитор',
       'Название заказчика', 'Unnamed: 25', 'Документ закупки', 'Unnamed: 27',
       'Unnamed: 28', 'Статус', 'Время', 'Время изменения', 'Дата платежа'],
      dtype='object')

In [147]:
zpp001[["Purpose Code","Номер заявки на платеж","Протокол","Номер договора","Инвойс"]].sample(n=5 ,random_state=38)

Unnamed: 0,Purpose Code,Номер заявки на платеж,Протокол,Номер договора,Инвойс
5220,"стержень анкерный, муфта",100000010538,AK-C-1138,AK-C-1138,PROFORMA
516,grinding paper/MMP/31-14765,100000024481,AK-657,AK-657,PROFORMA FATURA
4850,металлическая конструкция,100000011192,AK-С-745,TSM-07-22-1622,100008996
1999,Linde GAZ/ SMR/EMR/MMR,100000019451,AK-NP-EM-754,TSM-07-22-859,100036013
8684,Основной бит,100000000119,AK-NP-2082,AK-NP-2082,DKN202300000044


In [148]:
"""
import re
import pandas as pd

def extract_text_outside_quotes(zp_string):
    if pd.isna(zp_string) or not isinstance(zp_string, str):
        return None

    # Use regex to remove the quoted part (including the quotes)
    # The '.*?' makes the match non-greedy
    text_outside_quotes = re.sub(r'"(.*?)"', '', zp_string)

    # Trim any leading/trailing whitespace from the remaining text
    trimmed_text = text_outside_quotes.strip()

    # Return None if the result is an empty string, otherwise return the trimmed text
    return trimmed_text if trimmed_text else None

def format_zp_numbers(zp_string):
    if pd.isna(zp_string) or not isinstance(zp_string, str) or not zp_string.strip():
        return None

    # Try to extract content within double quotes first, for existing formats
    match_quoted = re.search(r'"([^"]*)"', zp_string)
    if match_quoted:
        # If quotes found, process only the content within them
        content_to_process = match_quoted.group(1)
    else:
        # If no quotes found, clean the whole string and process it
        content_to_process = zp_string.strip()

    # Find all '31' followed by digits, optionally with a hyphen, in the content_to_process
    # This will catch patterns like '31-14677', '3114677', '31-1234'
    # It ensures that only sequences starting with '31' and followed by digits are considered.
    zp_number_patterns = re.findall(r'31-?\d+', content_to_process)

    formatted_numbers = []
    for num_str in zp_number_patterns:
        # Remove any hyphens from the extracted pattern (e.g., '31-14677' -> '3114677')
        clean_num = num_str.replace('-', '')

        if clean_num.startswith('31') and len(clean_num) > 2:
            numeric_part = clean_num[2:] # Get the part after '31'
            if numeric_part.isdigit():
                # Pad with leading zeros to make the part after '31' 8 digits long
                padded_part = numeric_part.zfill(8);
                formatted_numbers.append('31' + padded_part)
            # If numeric_part is not digits, we skip it as it's not a valid ZP number part
        # If it doesn't start with '31' or is too short, we skip it
        # This function focuses specifically on '31' numbers.

    return ';'.join(formatted_numbers) if formatted_numbers else None
    """

  zp_number_patterns = re.findall(r'31-?\d+', content_to_process)


'\nimport re\nimport pandas as pd\n\ndef extract_text_outside_quotes(zp_string):\n    if pd.isna(zp_string) or not isinstance(zp_string, str):\n        return None\n\n    # Use regex to remove the quoted part (including the quotes)\n    # The \'.*?\' makes the match non-greedy\n    text_outside_quotes = re.sub(r\'"(.*?)"\', \'\', zp_string)\n\n    # Trim any leading/trailing whitespace from the remaining text\n    trimmed_text = text_outside_quotes.strip()\n\n    # Return None if the result is an empty string, otherwise return the trimmed text\n    return trimmed_text if trimmed_text else None\n\ndef format_zp_numbers(zp_string):\n    if pd.isna(zp_string) or not isinstance(zp_string, str) or not zp_string.strip():\n        return None\n\n    # Try to extract content within double quotes first, for existing formats\n    match_quoted = re.search(r\'"([^"]*)"\', zp_string)\n    if match_quoted:\n        # If quotes found, process only the content within them\n        content_to_process =

In [149]:
"""
# Apply the function to create the new column 'text_zo'
zpp001_dummy['text_zo'] = zpp001_dummy['Purpose Code'].astype(str).apply(extract_text_outside_quotes)

# Apply the updated function to the 'Номер заявки на платеж' column to create/update 'zp no clear'
zpp001_dummy['zp no clear'] = zpp001_dummy['Purpose Code'].astype(str).apply(format_zp_numbers)
"""

"\n# Apply the function to create the new column 'text_zo'\nzpp001_dummy['text_zo'] = zpp001_dummy['Purpose Code'].astype(str).apply(extract_text_outside_quotes)\n\n# Apply the updated function to the 'Номер заявки на платеж' column to create/update 'zp no clear'\nzpp001_dummy['zp no clear'] = zpp001_dummy['Purpose Code'].astype(str).apply(format_zp_numbers)\n"

In [150]:
#zpp001_dummy = zpp001_dummy.drop(columns=['zp no clear', 'text_zo'])

In [151]:
#zpp001_dummy['Номер заявки на платеж'] = zpp001_dummy['Номер заявки на платеж'].apply(temizle_ve_cevir)

In [152]:
#zpp001_dummy.loc[zpp001_dummy['Номер заявки на платеж'] == "100000024260", 'Purpose Code'] = "31-12/31235v31-522/313132 asdvv jfjfj фывв с"

In [153]:
#zpp001_dummy[zpp001_dummy['Номер заявки на платеж']=="100000024260"]

In [154]:
zpp001_dummy.columns

Index(['﻿Валюта оплаты', 'Номер заявки на платеж', 'Тип транзакции',
       'Тип документа', 'Тип платежа', 'Статья ДДС', 'Наименование',
       'Purpose Code', 'Протокол', 'Номер договора', 'Инвойс', 'Кредитор',
       'Название кредитора', 'Оплачиваемая сумма', 'Валюта', 'Автор изменения',
       'Дата изменения', 'Создал', 'Дата создания', 'Unnamed: 19',
       'Статус согласующего', 'Оплаченная Сумма', 'Unnamed: 22', 'Дебитор',
       'Название заказчика', 'Unnamed: 25', 'Документ закупки', 'Unnamed: 27',
       'Unnamed: 28', 'Статус', 'Время', 'Время изменения', 'Дата платежа'],
      dtype='object')

In [155]:
"""
columns_to_drop = [
    'Оплачиваемая сумма_zpp001', 'Оплаченная Сумма_zpp001',
    '\ufeffВалюта оплаты_zpp001', 'Тип транзакции_zpp001',
    'Тип документа_zpp001', 'Тип платежа_zpp001', 'Статья ДДС_zpp001',
    'Наименование_zpp001', 'Purpose Code_zpp001', 'Протокол_zpp001',
    'Номер договора_zpp001', 'Инвойс_zpp001', 'Кредитор_zpp001',
    'Название кредитора_zpp001', 'Валюта_zpp001', 'Автор изменения_zpp001',
    'Создал_zpp001', 'Статус согласующего_zpp001', 'Дебитор_zpp001',
    'Название заказчика_zpp001', 'Статус_zpp001', 'text_zo_zpp001',
    'zp no clear_zpp001', 'Дата изменения_zpp001', 'Дата создания_zpp001',
    'Дата платежа_zpp001', 'Время_zpp001', 'Время изменения_zpp001',
    'Документ_закупки_cleaned', 'Номер заявки на платеж_zpp001'
]

df_B3_status.drop(columns=columns_to_drop, inplace=True, errors='ignore')

print("Specified columns dropped from df_B3_status.")
print(f"df_B3_status now has {df_B3_status.shape[1]} columns and {df_B3_status.shape[0]} rows.")
"""

'\ncolumns_to_drop = [\n    \'Оплачиваемая сумма_zpp001\', \'Оплаченная Сумма_zpp001\',\n    \'\ufeffВалюта оплаты_zpp001\', \'Тип транзакции_zpp001\',\n    \'Тип документа_zpp001\', \'Тип платежа_zpp001\', \'Статья ДДС_zpp001\',\n    \'Наименование_zpp001\', \'Purpose Code_zpp001\', \'Протокол_zpp001\',\n    \'Номер договора_zpp001\', \'Инвойс_zpp001\', \'Кредитор_zpp001\',\n    \'Название кредитора_zpp001\', \'Валюта_zpp001\', \'Автор изменения_zpp001\',\n    \'Создал_zpp001\', \'Статус согласующего_zpp001\', \'Дебитор_zpp001\',\n    \'Название заказчика_zpp001\', \'Статус_zpp001\', \'text_zo_zpp001\',\n    \'zp no clear_zpp001\', \'Дата изменения_zpp001\', \'Дата создания_zpp001\',\n    \'Дата платежа_zpp001\', \'Время_zpp001\', \'Время изменения_zpp001\',\n    \'Документ_закупки_cleaned\', \'Номер заявки на платеж_zpp001\'\n]\n\ndf_B3_status.drop(columns=columns_to_drop, inplace=True, errors=\'ignore\')\n\nprint("Specified columns dropped from df_B3_status.")\nprint(f"df_B3_status 

In [156]:
"""
zpp001_dummy.drop(columns='Документ закупки_cleaned', inplace=True, errors='ignore')
zpp001_dummy.drop(columns='zp no clear', inplace=True, errors='ignore')
"""

"\nzpp001_dummy.drop(columns='Документ закупки_cleaned', inplace=True, errors='ignore')\nzpp001_dummy.drop(columns='zp no clear', inplace=True, errors='ignore')\n"

In [157]:
#df_B3_status["zp no clear_zpp001"]

In [158]:
zpp001_dummy.columns

Index(['﻿Валюта оплаты', 'Номер заявки на платеж', 'Тип транзакции',
       'Тип документа', 'Тип платежа', 'Статья ДДС', 'Наименование',
       'Purpose Code', 'Протокол', 'Номер договора', 'Инвойс', 'Кредитор',
       'Название кредитора', 'Оплачиваемая сумма', 'Валюта', 'Автор изменения',
       'Дата изменения', 'Создал', 'Дата создания', 'Unnamed: 19',
       'Статус согласующего', 'Оплаченная Сумма', 'Unnamed: 22', 'Дебитор',
       'Название заказчика', 'Unnamed: 25', 'Документ закупки', 'Unnamed: 27',
       'Unnamed: 28', 'Статус', 'Время', 'Время изменения', 'Дата платежа'],
      dtype='object')

In [160]:
df_me2n_2022_2025.columns

Index(['ГОД', 'Документ закупки', 'Позиция', 'Создал', 'Группа закупок',
       'Закуп. организация', 'Индикатор удаления', 'Дата документа',
       'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка', 'Позиция заявки',
       'Материал', 'Инвентарный номер', 'Наименование RU', 'Наименование TR',
       'Объем заказа', 'Складская ЕИ', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Уже поставлено (количество)',
       'Для фактурирования (стоим.)', 'Для фактурирования (колич.)',
       'Количество в СЕИ', 'Единица цены', 'СтоимЗаказа нетто', 'Валюта',
       'Цена нетто', 'Вид докум. закупки', 'Код налога', 'Краткий текст',
       'Дата поставки', 'ЕИ заказа на постав.', 'ТипДокумЗакупки',
       'Тип неполноты данных', 'Группа материалов', 'Материал_ME2N',
       'Материал_ME5A'],
      dtype='object')

In [162]:
df_me2n_2022_2025[["Материал","Наименование RU","Имя поставщика"]].sample(n=5)

Unnamed: 0,Материал,Наименование RU,Имя поставщика
333530,4500199095,"Знак дорожный 2.4 ""Уступите дорогу"" ГОСТ",1000010607 ERMAK İNŞ. MAK.SAN.İLETİ
12426,4500526153,S-5.1a10_Pi-75_0130.00UYB.SRP.TM.TB0016,2960 TİTAN2 IC İÇTAŞ İNŞAAT A
118560,4500081334,СТЕНД ОБВЯЗКИ 3-IIДД-Н-И1-В5 ТУ6937-032-,1000017791 SOSNOVOBORELEKTROMONTAJ
201884,4500409757,23/565-51 ТРОЙН. РАВН-610Х10,1000001676 ENERGY LINE AG
180071,4500340873,AKU.0120.20UJA.0.KZ.LC0253.TA1009/,2020 IC IÇTAS ENDÜSTRIYEL BOR


In [287]:
# Ensure 'Имя поставщика' column is string type for splitting
df_me2n_2022_2025['Имя поставщика'] = df_me2n_2022_2025['Имя поставщика'].astype(str)

# Split the 'Имя поставщика' column by the first space encountered
# expand=True will return a DataFrame with two columns if a space is found,
# or one column if no space, or all as one part.
# n=1 ensures only the first space is used for splitting.
split_result = df_me2n_2022_2025['Имя поставщика'].str.split(' ', n=1, expand=True)

# Assign the first part to 'Поставщик_split'
# For entries where 'Имя поставщика' was 'nan' string (from original pd.NA),
# split_result[0] will be 'nan'. We convert these back to pd.NA.
df_me2n_2022_2025['Поставщик_split'] = split_result[0].replace('nan', pd.NA)

# Assign the second part to 'имя_поставщика_split'
# If no space was found, split_result[1] will be None/NaN. We handle 'nan' string cases here.
df_me2n_2022_2025['имя_поставщика_split'] = split_result[1].replace('nan', pd.NA)

# Convert 'Поставщик_split' to numeric (Int64) where possible, coercing errors to NaN
df_me2n_2022_2025['Поставщик_split'] = pd.to_numeric(df_me2n_2022_2025['Поставщик_split'], errors='coerce').astype('Int64')

# Display the first few rows of the relevant columns to show the change
print(df_me2n_2022_2025[['Имя поставщика', 'Поставщик_split', 'имя_поставщика_split']].head())

                      Имя поставщика  Поставщик_split    имя_поставщика_split
0    1000001414 AERKLİMA MÜHENDİSLİK       1000001414    AERKLİMA MÜHENDİSLİK
1  1010000102 DEĞİŞİM ALTYAPI İNŞAAT       1010000102  DEĞİŞİM ALTYAPI İNŞAAT
2  1010000102 DEĞİŞİM ALTYAPI İNŞAAT       1010000102  DEĞİŞİM ALTYAPI İNŞAAT
3  1010000102 DEĞİŞİM ALTYAPI İNŞAAT       1010000102  DEĞİŞİM ALTYAPI İNŞAAT
4  1010000102 DEĞİŞİM ALTYAPI İNŞAAT       1010000102  DEĞİŞİM ALTYAPI İNŞAAT


In [292]:
df_me2n_2022_2025[['Имя поставщика', 'Поставщик_split', 'имя_поставщика_split']].sample(n=5)

Unnamed: 0,Имя поставщика,Поставщик_split,имя_поставщика_split
294771,1000001429 ÇÖZÜMÇELİK İNŞAAT TAAHHÜ,1000001429,ÇÖZÜMÇELİK İNŞAAT TAAHHÜ
1851,1000001143 BAYGÖK İNŞ.VE TİC.LTD.ŞT,1000001143,BAYGÖK İNŞ.VE TİC.LTD.ŞT
120612,1000001142 DK NET ENERJİ SANAYİ VE,1000001142,DK NET ENERJİ SANAYİ VE
91533,2020 IC IÇTAS ENDÜSTRIYEL BOR,2020,IC IÇTAS ENDÜSTRIYEL BOR
64786,1000001044 GÜR-AV İNŞAAT İBRAHİM AV,1000001044,GÜR-AV İNŞAAT İBRAHİM AV


In [298]:
me2n_sveta_1=df_me2n_2022_2025.copy()

In [299]:
me2n_sveta_1.columns

Index(['ГОД', 'Документ закупки', 'Позиция', 'Создал', 'Группа закупок',
       'Закуп. организация', 'Индикатор удаления', 'Дата документа',
       'Наш знак', 'Ваш код', 'Имя поставщика', 'Заявка', 'Позиция заявки',
       'Материал', 'Инвентарный номер', 'Наименование RU', 'Наименование TR',
       'Объем заказа', 'Складская ЕИ', 'еще поставить (количество)',
       'Еще для поставки (стоимость)', 'Уже поставлено (количество)',
       'Для фактурирования (стоим.)', 'Для фактурирования (колич.)',
       'Количество в СЕИ', 'Единица цены', 'СтоимЗаказа нетто', 'Валюта',
       'Цена нетто', 'Вид докум. закупки', 'Код налога', 'Краткий текст',
       'Дата поставки', 'ЕИ заказа на постав.', 'ТипДокумЗакупки',
       'Тип неполноты данных', 'Группа материалов', 'Материал_ME2N',
       'Материал_ME5A', 'Поставщик_', 'имя_поставщика_', 'Поставщик_split',
       'имя_поставщика_split'],
      dtype='object')

In [300]:
me2n_sveta_1[["Материал","Наименование RU","Поставщик_split","имя_поставщика_split"]].sample(n=5)

Unnamed: 0,Материал,Наименование RU,Поставщик_split,имя_поставщика_split
65444,4500489642,AKU.0120.00USY.0.KM.LC0005.B3/11003,2020,IC IÇTAS ENDÜSTRIYEL BOR
279882,4500275296,00SGC12AA095 Кран шаровый латунный муфто,300058,АО ОКАН
174532,4500282684,AKU.0120.10UJA.0.KM.LC0056.LB1-2037,2020,IC IÇTAS ENDÜSTRIYEL BOR
288887,4500216508,AKU.0179.40UJA.0.KM.LC0002 SB9,1000017674,TITAN TECHNOLOGY PIPELIN
208577,4500336283,AKU.0120.00USY.0.KM.LC0003.CrB1-4 /,2020,IC IÇTAS ENDÜSTRIYEL BOR


In [301]:
def get_top_n_suppliers(group, n):
    # Filter out rows where either 'Поставщик_' or 'имя_поставщика_' is NaN
    filtered_group = group.dropna(subset=['Поставщик_split', 'имя_поставщика_split']).copy()

    # Combine 'Поставщик_' and 'имя_поставщика_' into tuples
    # Ensure they are strings before combining to avoid issues with mixed types
    supplier_pairs = filtered_group.apply(
        lambda row: (str(row['Поставщик_split']), str(row['имя_поставщика_split'])),
        axis=1
    )

    # Calculate the frequency of each unique tuple
    frequency = supplier_pairs.value_counts()

    # Get the top n most frequent tuples
    top_n_pairs = frequency.head(n).index.tolist()

    # Extract supplier code and name from the tuples
    result_suppliers = []
    for supplier_code, supplier_name in top_n_pairs:
        result_suppliers.append((supplier_code, supplier_name))

    # If fewer than n unique suppliers, pad the result list with (pd.NA, pd.NA)
    while len(result_suppliers) < n:
        result_suppliers.append((pd.NA, pd.NA))

    return result_suppliers

In [302]:
top_suppliers_per_material = me2n_sveta_1.groupby('Материал').agg(
    Наименование_RU=('Наименование RU', 'first'),
    Top_Suppliers=('Поставщик_split', lambda x: get_top_n_suppliers(x.to_frame().assign(имя_поставщика_split=me2n_sveta_1.loc[x.index, 'имя_поставщика_split']), 3))
).reset_index()

print(top_suppliers_per_material.head())

     Материал                         Наименование_RU  \
0        7000           Основная строительная техника   
1        7006    Складская механизация для материалов   
2        7008  Складская механизация для оборудования   
3        7009               Техника передаваемая в JV   
4  2200000191                                    None   

                                       Top_Suppliers  
0  [(1000018162, KON-KUR OTO KURTARMA ARA), (1000...  
1  [(1000000513, AHMET MESUT İNAN - KON-F), (<NA>...  
2  [(1000018162, KON-KUR OTO KURTARMA ARA), (<NA>...  
3  [(1000018162, KON-KUR OTO KURTARMA ARA), (<NA>...  
4  [(1000017133, ŞEYHMUS ORAL-ORASEL HIRD), (<NA>...  


In [303]:
for i in range(1, 4):
    top_suppliers_per_material[f'Поставщик_split{i}'] = top_suppliers_per_material['Top_Suppliers'].apply(lambda x: x[i-1][0] if len(x) >= i else pd.NA)
    top_suppliers_per_material[f'имя_поставщика_split{i}'] = top_suppliers_per_material['Top_Suppliers'].apply(lambda x: x[i-1][1] if len(x) >= i else pd.NA)

top_suppliers_per_material.drop(columns=['Top_Suppliers'], inplace=True)

print(top_suppliers_per_material.head())

     Материал                         Наименование_RU Поставщик_split1  \
0        7000           Основная строительная техника       1000018162   
1        7006    Складская механизация для материалов       1000000513   
2        7008  Складская механизация для оборудования       1000018162   
3        7009               Техника передаваемая в JV       1000018162   
4  2200000191                                    None       1000017133   

      имя_поставщика_split1 Поставщик_split2     имя_поставщика_split2  \
0  KON-KUR OTO KURTARMA ARA       1000000513  AHMET MESUT İNAN - KON-F   
1  AHMET MESUT İNAN - KON-F             <NA>                      <NA>   
2  KON-KUR OTO KURTARMA ARA             <NA>                      <NA>   
3  KON-KUR OTO KURTARMA ARA             <NA>                      <NA>   
4  ŞEYHMUS ORAL-ORASEL HIRD             <NA>                      <NA>   

  Поставщик_split3 имя_поставщика_split3  
0             <NA>                  <NA>  
1             <NA>      

In [304]:
top_suppliers_per_material.columns

Index(['Материал', 'Наименование_RU', 'Поставщик_split1',
       'имя_поставщика_split1', 'Поставщик_split2', 'имя_поставщика_split2',
       'Поставщик_split3', 'имя_поставщика_split3'],
      dtype='object')

In [330]:
top_suppliers_per_material.sample(n=5)

Unnamed: 0,Материал,Наименование_RU,Поставщик_split1,имя_поставщика_split1,Поставщик_split2,имя_поставщика_split2,Поставщик_split3,имя_поставщика_split3
77250,4500287089,AKU.0120.00USY.0.KM.LC0013.B3-9,2020,IC IÇTAS ENDÜSTRIYEL BOR,,,,
195347,4500456977,00PJB12AA509 КРАН ШАРОВЫЙ,2960,TİTAN2 IC İÇTAŞ İNŞAAT A,,,,
2793,4500074465,Инструмент ручной: губка штукатурная,1000017133,ŞEYHMUS ORAL-ORASEL HIRD,1000016769.0,ESPADA YAPI MARKET SAN.T,1000018840.0,OCAK HIRDAVAT MEK. MÜH.
26200,4500199280,ПРУЖИНА ПЛАСТИКОВАЯ ДЛЯ ПЕРЕПЛЕТА 32 ММ,300057,MSH MAKİNA TARIM OTOMOTİ,300004.0,AYTAÇ BAKMAZ,1000018840.0,OCAK HIRDAVAT MEK. MÜH.
91818,4500306083,AKU.0120.00USY.0.KM.LC0029.STR2/25,300043,MCM CONSTRUCTION İNŞAAT,,,,


In [331]:
top_suppliers_per_material.to_excel("sveta_1.xlsx", index=False)
files.download("sveta_1.xlsx")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [332]:
sveta_2=top_suppliers_per_material.copy()

In [333]:
sveta_2.columns

Index(['Материал', 'Наименование_RU', 'Поставщик_split1',
       'имя_поставщика_split1', 'Поставщик_split2', 'имя_поставщика_split2',
       'Поставщик_split3', 'имя_поставщика_split3'],
      dtype='object')

In [334]:
def create_supplier_name_string(row):
    names = []
    for i in range(1, 4):
        name_col = f'имя_поставщика_split{i}'
        if pd.notna(row[name_col]):
            names.append(str(row[name_col]))
    return ";".join(names) if names else pd.NA

sveta_2["имя_поставщика"] = sveta_2.apply(create_supplier_name_string, axis=1)

In [335]:
def create_supplier_code_string(row):
    codes = []
    for i in range(1, 4):
        code_col = f'Поставщик_split{i}'
        if pd.notna(row[code_col]):
            codes.append(str(row[code_col]))
    return ";".join(codes) if codes else pd.NA

sveta_2["Поставщик"] = sveta_2.apply(create_supplier_code_string, axis=1)

In [336]:
sveta_2["имя_поставщика+Поставщик"]=sveta_2["имя_поставщика_split1"]+"_"+sveta_2["Поставщик_split1"]+";"+sveta_2["имя_поставщика_split2"]+"_"+sveta_2["Поставщик_split2"]+";"+sveta_2["имя_поставщика_split3"]+"_"+sveta_2["Поставщик_split3"]

In [337]:
def create_combined_supplier_string(row):
    combined_parts = []
    for i in range(1, 4):
        name_col = f'имя_поставщика_split{i}'
        code_col = f'Поставщик_split{i}'
        if pd.notna(row[name_col]) and pd.notna(row[code_col]):
            combined_parts.append(f"{row[name_col]}_{row[code_col]}")
    return ";".join(combined_parts) if combined_parts else pd.NA

sveta_2["имя_поставщика+Поставщик"] = sveta_2.apply(create_combined_supplier_string, axis=1)

In [349]:
sveta_2.sample(n=5)

Unnamed: 0,Материал,Наименование_RU,Поставщик_split1,имя_поставщика_split1,Поставщик_split2,имя_поставщика_split2,Поставщик_split3,имя_поставщика_split3,имя_поставщика,Поставщик,имя_поставщика+Поставщик
171417,4500417863,ШАРНИРНАЯ ГАЙКА-ШАЙБА DW 15 30370 PERI,300060,BYKARA GAYRİMENKUL İNS,,,,,BYKARA GAYRİMENKUL İNS,300060,BYKARA GAYRİMENKUL İNS_300060
90556,4500304798,AKU.0120.00USY.0.KM.LC0028 Str2-19,1000001429,ÇÖZÜMÇELİK İNŞAAT TAAHHÜ,,,,,ÇÖZÜMÇELİK İNŞAAT TAAHHÜ,1000001429,ÇÖZÜMÇELİK İNŞAAT TAAHHÜ_1000001429
233979,4500513312,AKU.0120.10UKC.0.KM.LC0010 7M-2,2020,IC IÇTAS ENDÜSTRIYEL BOR,,,,,IC IÇTAS ENDÜSTRIYEL BOR,2020,IC IÇTAS ENDÜSTRIYEL BOR_2020
231420,4500507817,S-5.1a_Pi-mm_10UQA.PUF.TW.TB0003,2960,TİTAN2 IC İÇTAŞ İNŞAAT A,,,,,TİTAN2 IC İÇTAŞ İNŞAAT A,2960,TİTAN2 IC İÇTAŞ İNŞAAT A_2960
59356,4500265061,10UJA.JNA.TM.TB0101.22/05.12JNA51BQ020/1,1000001420,İNCE İŞ METAL PROJE İNŞ.,,,,,İNCE İŞ METAL PROJE İNŞ.,1000001420,İNCE İŞ METAL PROJE İNŞ._1000001420


In [347]:
sveta_2.to_excel("sveta_2.xlsx", index=False)
files.download("sveta_2.xlsx")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

## Display the resulting DataFrame

### Subtask:
Show the head of the final DataFrame, which will contain 'Материал', 'Наименование RU', and the top 3 supplier columns.


## Summary:

### Data Analysis Key Findings

*   A custom function, `get_top_n_suppliers`, was successfully defined to identify the top N suppliers for a given material. This function correctly filters out `NaN` values, counts the frequency of unique supplier code and name pairs, and pads the result with `pd.NA` if fewer than N suppliers are found.
*   The `me2n_sveta_1` DataFrame was successfully grouped by 'Материал'. For each material, the first 'Наименование RU' was extracted, and the `get_top_n_suppliers` function was applied to determine the top 3 suppliers, storing them as a list of tuples in a temporary 'Top\_Suppliers' column.
*   The 'Top\_Suppliers' column was successfully expanded into distinct columns for supplier codes and names: `Поставщик_1`, `имя_поставщика_1`, `Поставщик_2`, `имя_поставщика_2`, `Поставщик_3`, and `имя_поставщика_3`. For materials with fewer than 3 unique suppliers, the corresponding columns were populated with `pd.NA`.
*   The final resulting DataFrame, `top_suppliers_per_material`, contains each unique 'Материал', its corresponding 'Наименование RU', and the identified top 3 supplier codes and names in separate columns.

### Insights or Next Steps

*   This structured output allows for easy comparison of preferred suppliers across different materials, which can be valuable for procurement strategies and supplier management.
*   Further analysis could involve calculating the percentage of purchases from the top 3 suppliers for each material to understand supplier concentration and potential risks or opportunities for diversification.
