# Libraries

In [52]:
import pandas as pd
import numpy as np
import os
import matplotlib.pyplot as plt
import seaborn as sns
import calendar
from datetime import datetime
import warnings
warnings.filterwarnings("ignore")

---

# Read Files

In [53]:
# List of Excel Files
sales_lst = sorted([doc_ for doc_ in os.listdir("../data") if doc_.startswith("Demand Sensing Sales History") or doc_.startswith("Demand_Sensing_Sales_")])
saha_aktivite_lst = sorted([doc_ for doc_ in os.listdir("../data") if doc_.startswith("Demand_Sensing_Saha_Aktivit") or doc_.startswith("Demand Sensing Saha Aktivit")])
pasifik_aktivite_lst = sorted([doc_ for doc_ in os.listdir("../data") if doc_.startswith("Pasifik Aktivite Datası")])
fiyat_lst = sorted([doc_ for doc_ in os.listdir("../data") if "Fiyat List" in doc_])
portfoy_lst = sorted([doc_ for doc_ in os.listdir("../data") if doc_.startswith("Portföy")])
eslenik_kod_lst = sorted([doc_ for doc_ in os.listdir("../data") if doc_.startswith("Ürün Eşlenik kodlar")])

---
# Read Data
---

In [54]:
# Read Sales Data
pasifik_df_all = []
btt_df_all = []
horizon_saha_df_all = []
chng_cols_beginning = {'Year': 'Yıl', 'Quarter': 'Çeyrek', 'Month': 'Ay', 
 'Company Code': 'Şirket Kodu', 'Main Category Name': 'Ana Kategori Adı', 
 'Category Name': 'Kategori Adı', 'Brand Name': 'Marka Adı', 'Product Code': 'Ürün Kodu', 
 'Product Name': 'Ürün Adı', "Ürün Adı (Mobis)": 'Ürün Adı'}
for docs_ in sales_lst:
    pasifik_df_all.append(pd.read_excel("../data/"+docs_, skiprows=1, sheet_name="Pasifik SAP Satış", usecols="B:P").rename(columns=chng_cols_beginning))
    btt_df_all.append(pd.read_excel("../data/"+docs_, skiprows=1, sheet_name="BTT SAP Satış", usecols="B:N").rename(columns=chng_cols_beginning))
    horizon_saha_df_all.append(pd.read_excel("../data/"+docs_, skiprows=1, sheet_name="Horizon Saha Satış", usecols="B:N").rename(columns=chng_cols_beginning))
pasifik_df_all = pd.concat(pasifik_df_all)
btt_df_all = pd.concat(btt_df_all)
horizon_saha_df_all = pd.concat(horizon_saha_df_all)


chng_cols = {"Saha Müşteri Grup": "Grup adı", "Ürün Adı (Mobis)": "Ürün Adı"}

pasifik_df_all.rename(columns=chng_cols, inplace=True)
btt_df_all.rename(columns=chng_cols, inplace=True)
horizon_saha_df_all.rename(columns=chng_cols, inplace=True)

btt_df_all["Grup adı"], btt_df_all["Grup Kodu."] = "BTT", 0
horizon_saha_df_all["Şirket Kodu"], horizon_saha_df_all["Grup Kodu."] = 0, 0

btt_df_all = btt_df_all[pasifik_df_all.columns.to_list()]
horizon_saha_df_all = horizon_saha_df_all[pasifik_df_all.columns.to_list()]

In [55]:
# Read Saha Aktiviteleri
saha_aktivite_detay = []
saha_aktivite_cat = []

for docs_ in saha_aktivite_lst:
    saha_aktivite_detay.append(pd.read_excel("../data/"+docs_, skiprows=1, sheet_name="Ürün Detay", usecols="B:M"))
    saha_aktivite_cat.append(pd.read_excel("../data/"+docs_, skiprows=1, sheet_name="Kategori", usecols="B:I"))
saha_aktivite_detay = pd.concat(saha_aktivite_detay)
saha_aktivite_cat = pd.concat(saha_aktivite_cat)

In [56]:
# Read Pasifik Aktiviteleri
pasifik_aktivite_df = pd.read_excel("../data/"+pasifik_aktivite_lst[0])

In [57]:
# Read Fiyat Listesi
fiyat_lst_pasifik = pd.read_excel("../data/"+fiyat_lst[0])
fiyat_lst_horizon = pd.read_excel("../data/"+fiyat_lst[1])

In [58]:
# Read Portföy
pasifik_portfoy_df = pd.read_excel("../data/"+portfoy_lst[0], sheet_name="Pasifik Portföy", skiprows=3, usecols="D:H")
btt_portfoy_df = pd.read_excel("../data/"+portfoy_lst[0], sheet_name="BTT Portföy", skiprows=2, usecols="D:H")
horizon_portfoy_df = pd.read_excel("../data/"+portfoy_lst[0], sheet_name="Horizon Portföy", skiprows=2, usecols="E:I")

In [59]:
# Read Eşlenik Kodları
eslenik_kod_df = pd.read_excel("../data/"+eslenik_kod_lst[0])

In [60]:
# Read Calender
calender_df = pd.read_excel("../data/Calender_Monthly.xlsx")

In [61]:
# Read Plasiyer Yarışma
plasiyer_yarisma = pd.read_excel("../data/2018-2021 Yarışmaları.xlsx")

In [62]:
eslenik_kod_df["En Güncel Kod"] = eslenik_kod_df["En Güncel Kod"].apply(lambda x: int(x) if x not in ['delist ', "delist"] else x.replace(" ", ""))

---
# Pasifik 2016 aktivite verileri olmadığı için 2016 Sales dataları çıkartıldı.

In [63]:
pasifik_df_all = pasifik_df_all[pasifik_df_all["Yıl"] != 2016].reset_index(drop=True)

---

---

# Sales Datası İçin Ürün Kod Eşleme

---

---

## Join

In [64]:
pasifik_df_all = pd.merge(pasifik_df_all, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], on="Ürün Kodu", how="left")
btt_df_all = pd.merge(btt_df_all, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], on="Ürün Kodu", how="left")
horizon_saha_df_all = pd.merge(horizon_saha_df_all, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], on="Ürün Kodu", how="left")

In [65]:
pasifik_eslenik_kod_olmayan = pasifik_df_all[pd.isnull(pasifik_df_all["En Güncel Kod"])]
pasifik_eslenik_kod_olmayan_unique = pd.DataFrame(pasifik_df_all[pd.isnull(pasifik_df_all["En Güncel Kod"])]["Ürün Kodu"].unique(), columns=["Ürün Kodu"])

writer_pasifik = pd.ExcelWriter("../reports/pasifik_eslenik_kodu_olmayan.xlsx", engine = 'xlsxwriter')

pasifik_eslenik_kod_olmayan_unique.to_excel(writer_pasifik, sheet_name = 'eslenik_kod_olmayan_sku',index=False)
pasifik_eslenik_kod_olmayan.to_excel(writer_pasifik, sheet_name = 'eslenik_kod_olmayan_data',index=False)

writer_pasifik.save()
writer_pasifik.close()

In [66]:
btt_eslenik_kod_olmayan = btt_df_all[pd.isnull(btt_df_all["En Güncel Kod"])]
btt_eslenik_kod_olmayan_unique = pd.DataFrame(btt_df_all[pd.isnull(btt_df_all["En Güncel Kod"])]["Ürün Kodu"].unique(), columns=["Ürün Kodu"])

writer_btt = pd.ExcelWriter("../reports/btt_eslenik_kodu_olmayan.xlsx", engine = 'xlsxwriter')

btt_eslenik_kod_olmayan_unique.to_excel(writer_btt, sheet_name = 'eslenik_kod_olmayan_sku',index=False)
btt_eslenik_kod_olmayan.to_excel(writer_btt, sheet_name = 'eslenik_kod_olmayan_data',index=False)

writer_btt.save()
writer_btt.close()

In [67]:
horizon_eslenik_kod_olmayan = horizon_saha_df_all[pd.isnull(horizon_saha_df_all["En Güncel Kod"])]
horizon_eslenik_kod_olmayan_unique = pd.DataFrame(horizon_saha_df_all[pd.isnull(horizon_saha_df_all["En Güncel Kod"])]["Ürün Kodu"].unique(), columns=["Ürün Kodu"])

writer_horizon = pd.ExcelWriter("../reports/horizon_eslenik_kodu_olmayan.xlsx", engine = 'xlsxwriter')

horizon_eslenik_kod_olmayan_unique.to_excel(writer_horizon, sheet_name = 'eslenik_kod_olmayan_sku',index=False)
horizon_eslenik_kod_olmayan.to_excel(writer_horizon, sheet_name = 'eslenik_kod_olmayan_data',index=False)

writer_horizon.save()
writer_horizon.close()

## Ürün Eşleme Kodları dosyasında yer almayan kodlar için mevcut ürün kodları verildi.

In [68]:
empty_ = pasifik_df_all[pd.isnull(pasifik_df_all["En Güncel Kod"])].reset_index(drop=True)
full_ = pasifik_df_all[~pd.isnull(pasifik_df_all["En Güncel Kod"])].reset_index(drop=True)
empty_["En Güncel Kod"] = empty_["Ürün Kodu"]
pasifik_df_all = pd.concat([empty_, full_], axis=0, ignore_index=True)
pasifik_df_all = pasifik_df_all.sort_values(pasifik_df_all.columns.to_list()).reset_index(drop=True)

empty_ = btt_df_all[pd.isnull(btt_df_all["En Güncel Kod"])].reset_index(drop=True)
full_ = btt_df_all[~pd.isnull(btt_df_all["En Güncel Kod"])].reset_index(drop=True)
empty_["En Güncel Kod"] = empty_["Ürün Kodu"]
btt_df_all = pd.concat([empty_, full_], axis=0, ignore_index=True)
btt_df_all = btt_df_all.sort_values(btt_df_all.columns.to_list()).reset_index(drop=True)

empty_ = horizon_saha_df_all[pd.isnull(horizon_saha_df_all["En Güncel Kod"])].reset_index(drop=True)
full_ = horizon_saha_df_all[~pd.isnull(horizon_saha_df_all["En Güncel Kod"])].reset_index(drop=True)
empty_["En Güncel Kod"] = empty_["Ürün Kodu"]
horizon_saha_df_all = pd.concat([empty_, full_], axis=0, ignore_index=True)
horizon_saha_df_all = horizon_saha_df_all.sort_values(horizon_saha_df_all.columns.to_list()).reset_index(drop=True)

## Adet adında yeni bir kolon oluşturuldu.

In [69]:
pasifik_df_all["Adet"] = pasifik_df_all["Koli İçi Adet"] * pasifik_df_all["Koli"]
btt_df_all["Adet"] = btt_df_all["Koli İçi Adet"] * btt_df_all["Koli"]
horizon_saha_df_all["Adet"] = horizon_saha_df_all["Koli İçi Adet"] * horizon_saha_df_all["Koli"]

## Delist olan ürünler veriden çıkartıldı.

In [70]:
pasifik_df_all = pasifik_df_all[pasifik_df_all["En Güncel Kod"] != "delist"].reset_index(drop=True)
btt_df_all = btt_df_all[btt_df_all["En Güncel Kod"] != "delist"].reset_index(drop=True)
horizon_saha_df_all = horizon_saha_df_all[horizon_saha_df_all["En Güncel Kod"] != "delist"].reset_index(drop=True)

## Aynı yıl, ay, grup adı, ana kategori adı, kategori adı, marka adı ve SKU kodundaki ürünler için toplam alındı. Sadece Koli İçi Adet için maksimum olan alındı.

---

# Marka adı dahil değil groupby'a
---

In [71]:
dct_to_sum = {"Koli İçi Adet": "sum", "Koli": "sum", "KG": "sum", "TL": "sum", "Adet": "sum"}

pasifik_df_all2 = pasifik_df_all.groupby(["Yıl", "Ay", "Grup adı", "Ana Kategori Adı", "Kategori Adı", "En Güncel Kod"]).agg(dct_to_sum).reset_index()
btt_df_all2 = btt_df_all.groupby(["Yıl", "Ay", "Grup adı", "Ana Kategori Adı", "Kategori Adı", "En Güncel Kod"]).agg(dct_to_sum).reset_index()
horizon_saha_df_all2 = horizon_saha_df_all.groupby(["Yıl", "Ay", "Grup adı", "Ana Kategori Adı", "Kategori Adı", "En Güncel Kod"]).agg(dct_to_sum).reset_index()

In [72]:
pasifik_df_all2["Date"] = pasifik_df_all2["Yıl"].astype(str) + "-" +  pasifik_df_all2["Ay"].astype(str) + "-01"
btt_df_all2["Date"] = btt_df_all2["Yıl"].astype(str) + "-" +  btt_df_all2["Ay"].astype(str) + "-01"
horizon_saha_df_all2["Date"] = horizon_saha_df_all2["Yıl"].astype(str) + "-" +  horizon_saha_df_all2["Ay"].astype(str) + "-01"

pasifik_df_all2["Date"] = pd.to_datetime(pasifik_df_all2["Date"], format="%Y-%m-%d", errors="coerce")
btt_df_all2["Date"] = pd.to_datetime(btt_df_all2["Date"], format="%Y-%m-%d", errors="coerce")
horizon_saha_df_all2["Date"] = pd.to_datetime(horizon_saha_df_all2["Date"], format="%Y-%m-%d", errors="coerce")

## Horizon ve Pasifikte bulunan "Diğer"'lerin yanlarına "_" ile Diğer_Pasifik, Diğer_Horizon yazıldı.

In [73]:
pasifik_df_all2["Grup adı"] = pasifik_df_all2["Grup adı"].apply(lambda x: "Diğer_Pasifik" if x == "Diğer" else x)
horizon_saha_df_all2["Grup adı"] = horizon_saha_df_all2["Grup adı"].apply(lambda x: "Diğer_Horizon" if x == "Diğer" else x)

# Kontrol: Herhangi bir SKU için koli içi adeti birden fazla geldi mi?

---

In [74]:
pasifik_temp = pasifik_df_all.copy()
btt_temp = btt_df_all.copy()
horizon_temp = horizon_saha_df_all.copy()

pasifik_temp["Grup adı"] = pasifik_temp["Grup adı"].apply(lambda x: "Diğer_Pasifik" if x == "Diğer" else x)
horizon_temp["Grup adı"] = horizon_temp["Grup adı"].apply(lambda x: "Diğer_Horizon" if x == "Diğer" else x)

In [75]:
unique = pd.concat([pasifik_temp, btt_temp, horizon_temp], axis=0, ignore_index=True)

koli_ici_fark = pd.concat([unique.groupby(["En Güncel Kod", "Grup adı"]).agg({"Koli İçi Adet": "min"}), unique.groupby(["En Güncel Kod", "Grup adı"]).agg({"Koli İçi Adet": "max"})], axis=1)
koli_ici_fark.columns = ["min", "max"]
koli_ici_fark["Fark"] = koli_ici_fark["max"] - koli_ici_fark["min"]
koli_ici_fark.reset_index(inplace=True)
koli_ici_fark[koli_ici_fark["Fark"] != 0].to_excel("../reports/ayni_sku_kod_farkli_koli_adedi.xlsx", index=False)

# Kontrol: Güncel Koda denk gelen eski ürün isimleri neler?

In [76]:
unique_pasifik = pasifik_df_all[["En Güncel Kod", "Ürün Adı"]]
unique_btt = btt_df_all[["En Güncel Kod", "Ürün Adı"]]
unique_horizon = horizon_saha_df_all[["En Güncel Kod", "Ürün Adı"]]

unique_pasifik = unique_pasifik.drop_duplicates(subset=["En Güncel Kod", "Ürün Adı"]).reset_index(drop=True)
unique_btt = unique_btt.drop_duplicates(subset=["En Güncel Kod", "Ürün Adı"]).reset_index(drop=True)
unique_horizon = unique_horizon.drop_duplicates(subset=["En Güncel Kod", "Ürün Adı"]).reset_index(drop=True)

unique_pasifik.groupby("En Güncel Kod")["Ürün Adı"].agg(lambda x: "-".join(x)).to_excel("../reports/pasifik_guncel_kod_karsiligi_urunler.xlsx", index=True)
unique_btt.groupby("En Güncel Kod")["Ürün Adı"].agg(lambda x: "-".join(x)).to_excel("../reports/btt_guncel_kod_karsiligi_urunler.xlsx", index=True)
unique_horizon.groupby("En Güncel Kod")["Ürün Adı"].agg(lambda x: "-".join(x)).to_excel("../reports/horizon_guncel_kod_karsiligi_urunler.xlsx", index=True)

---

---

# SKU bazında gözlem sayısı

In [77]:
num_pasifik = pasifik_df_all2.groupby(["En Güncel Kod", "Grup adı"]).count()["Yıl"].reset_index().rename(columns={"Yıl": "Count"})
num_btt = btt_df_all2.groupby(["En Güncel Kod", "Grup adı"]).count()["Yıl"].reset_index().rename(columns={"Yıl": "Count"})
num_horizon = horizon_saha_df_all2.groupby(["En Güncel Kod", "Grup adı"]).count()["Yıl"].reset_index().rename(columns={"Yıl": "Count"})

In [78]:
num_all = pd.concat([num_btt, num_horizon, num_pasifik], ignore_index=True, axis=0)
num_all.sort_values(by=["En Güncel Kod", "Grup adı", "Count"], inplace=True)
num_all.to_excel("../reports/sku_bazinda_sayilar.xlsx", index=False)

---

---
# Missing Value'lara 0 atanması
---

---
# Pasifik Filling Missing Values
---

In [79]:
pasifik_urun_isimleri = pasifik_df_all[["Marka Adı", "Ürün Adı", "En Güncel Kod"]].drop_duplicates(subset=["Marka Adı", "En Güncel Kod"],ignore_index=True,keep="first")
pasifik_urun_isimleri = pasifik_urun_isimleri[~((pasifik_urun_isimleri["Marka Adı"] == "DANKEK BATON") & (pasifik_urun_isimleri["En Güncel Kod"] == 80403))]
pasifik_df_all2 = pd.merge(pasifik_df_all2, pasifik_urun_isimleri[["En Güncel Kod", "Marka Adı", "Ürün Adı"]].drop_duplicates(subset=["En Güncel Kod", "Marka Adı", "Ürün Adı"], keep="first"), on="En Güncel Kod", how="left")
pasifik_df_all2 = pasifik_df_all2[pasifik_df_all2.columns.to_list()[:5]+pasifik_df_all2.columns.to_list()[-2:]+[pasifik_df_all2.columns.to_list()[5]]+pasifik_df_all2.columns.to_list()[6:12]]



horizon_urun_isimleri = horizon_saha_df_all[["Marka Adı", "Ürün Adı", "En Güncel Kod"]].drop_duplicates(subset=["Marka Adı", "En Güncel Kod"],ignore_index=True,keep="first")
horizon_urun_isimleri = horizon_urun_isimleri[~(((horizon_urun_isimleri["Marka Adı"] == "DANKEK BATON") & (horizon_urun_isimleri["En Güncel Kod"] == 80403)) | 
                                                ((horizon_urun_isimleri["Marka Adı"] == "MAVİ YEŞİL") & (horizon_urun_isimleri["En Güncel Kod"] == 11802)) |
                                                ((horizon_urun_isimleri["Marka Adı"] == "MAVİ YEŞİL") & (horizon_urun_isimleri["En Güncel Kod"] == 74306)) |
                                                ((horizon_urun_isimleri["Marka Adı"] == "AS KRAKER") & (horizon_urun_isimleri["En Güncel Kod"] == 190502)))]
horizon_saha_df_all2 = pd.merge(horizon_saha_df_all2, horizon_urun_isimleri[["En Güncel Kod", "Marka Adı", "Ürün Adı"]], on="En Güncel Kod", how="left")
horizon_saha_df_all2 = horizon_saha_df_all2[horizon_saha_df_all2.columns.to_list()[:5]+horizon_saha_df_all2.columns.to_list()[-2:]+[horizon_saha_df_all2.columns.to_list()[5]]+horizon_saha_df_all2.columns.to_list()[6:12]]



btt_urun_isimleri = btt_df_all[["Marka Adı", "Ürün Adı", "En Güncel Kod"]].drop_duplicates(subset=["Marka Adı", "En Güncel Kod"],ignore_index=True,keep="first")
btt_urun_isimleri = btt_urun_isimleri[~((btt_urun_isimleri["Marka Adı"] == "DANKEK BATON") & (btt_urun_isimleri["En Güncel Kod"] == 80403))]
btt_df_all2 = pd.merge(btt_df_all2, btt_urun_isimleri[["En Güncel Kod", "Marka Adı", "Ürün Adı"]].drop_duplicates(subset=["En Güncel Kod", "Marka Adı", "Ürün Adı"], keep="first"), on="En Güncel Kod", how="left")
btt_df_all2 = btt_df_all2[btt_df_all2.columns.to_list()[:5]+btt_df_all2.columns.to_list()[-2:]+[btt_df_all2.columns.to_list()[5]]+btt_df_all2.columns.to_list()[6:12]]

In [80]:
pasifik_df_all_filled = []
for idx, test in pasifik_df_all2.groupby(["En Güncel Kod", "Yıl", "Grup adı"]):
    test.reset_index(drop=True, inplace=True)
    for i in range(1, 13):
        try:
            if i == test.loc[i-1, "Ay"]:
                if i == 13:
                    break
            else:
                test.loc[-1] = test.loc[0]
                test.loc[-1, "Ay"], test.loc[-1, "Koli İçi Adet"], test.loc[-1, "Koli"],  \
                test.loc[-1, "KG"], test.loc[-1, "TL"], test.loc[-1, "Adet"], test.loc[-1, "Date"] = i, 0, 0, 0, 0, 0, str(test.loc[-1, "Yıl"])+"-"+str(i)+"-"+str("01")
                test = test.sort_values(by=["Yıl", "Ay"]).reset_index(drop=True)
        except:
            test.loc[-1] = test.loc[0]
            test.loc[-1, "Ay"], test.loc[-1, "Koli İçi Adet"], test.loc[-1, "Koli"],  \
            test.loc[-1, "KG"], test.loc[-1, "TL"], test.loc[-1, "Adet"], test.loc[-1, "Date"] = i, 0, 0, 0, 0, 0, str(test.loc[-1, "Yıl"])+"-"+str(i)+"-"+str("01")
            test = test.sort_values(by=["Yıl", "Ay"]).reset_index(drop=True)
        test["Date"] = pd.to_datetime(test["Date"], format="%Y-%m-%d", errors="coerce")
    pasifik_df_all_filled.append(test)

In [81]:
pasifik_df_all2 = pd.concat(pasifik_df_all_filled, ignore_index=True)

---
# Horizon Filling Missing Values
---

In [82]:
horizon_saha_df_all_filled = []
for idx, test in horizon_saha_df_all2.groupby(["En Güncel Kod", "Yıl", "Grup adı"]):
    test.reset_index(drop=True, inplace=True)
    for i in range(1, 13):
        try:
            if i == test.loc[i-1, "Ay"]:
                if i == 13:
                    break
            else:
                test.loc[-1] = test.loc[0]
                test.loc[-1, "Ay"], test.loc[-1, "Koli İçi Adet"], test.loc[-1, "Koli"],  \
                test.loc[-1, "KG"], test.loc[-1, "TL"], test.loc[-1, "Adet"], test.loc[-1, "Date"] = i, 0, 0, 0, 0, 0, str(test.loc[-1, "Yıl"])+"-"+str(i)+"-"+str("01")
                test = test.sort_values(by=["Yıl", "Ay"]).reset_index(drop=True)
        except:
            test.loc[-1] = test.loc[0]
            test.loc[-1, "Ay"], test.loc[-1, "Koli İçi Adet"], test.loc[-1, "Koli"],  \
            test.loc[-1, "KG"], test.loc[-1, "TL"], test.loc[-1, "Adet"], test.loc[-1, "Date"] = i, 0, 0, 0, 0, 0, str(test.loc[-1, "Yıl"])+"-"+str(i)+"-"+str("01")
            test = test.sort_values(by=["Yıl", "Ay"]).reset_index(drop=True)
        test["Date"] = pd.to_datetime(test["Date"], format="%Y-%m-%d", errors="coerce")
    horizon_saha_df_all_filled.append(test)

In [83]:
horizon_saha_df_all2 = pd.concat(horizon_saha_df_all_filled, ignore_index=True)

---
# BTT Filling Missing Values
---

In [84]:
btt_df_all_filled = []
for idx, test in btt_df_all2.groupby(["En Güncel Kod", "Yıl", "Grup adı"]):
    test.reset_index(drop=True, inplace=True)
    for i in range(1, 13):
        try:
            if i == test.loc[i-1, "Ay"]:
                if i == 13:
                    break
            else:
                test.loc[-1] = test.loc[0]
                test.loc[-1, "Ay"], test.loc[-1, "Koli İçi Adet"], test.loc[-1, "Koli"],  \
                test.loc[-1, "KG"], test.loc[-1, "TL"], test.loc[-1, "Adet"], test.loc[-1, "Date"] = i, 0, 0, 0, 0, 0, str(test.loc[-1, "Yıl"])+"-"+str(i)+"-"+str("01")
                test = test.sort_values(by=["Yıl", "Ay"]).reset_index(drop=True)
        except:
            test.loc[-1] = test.loc[0]
            test.loc[-1, "Ay"], test.loc[-1, "Koli İçi Adet"], test.loc[-1, "Koli"],  \
            test.loc[-1, "KG"], test.loc[-1, "TL"], test.loc[-1, "Adet"], test.loc[-1, "Date"] = i, 0, 0, 0, 0, 0, str(test.loc[-1, "Yıl"])+"-"+str(i)+"-"+str("01")
            test = test.sort_values(by=["Yıl", "Ay"]).reset_index(drop=True)
        test["Date"] = pd.to_datetime(test["Date"], format="%Y-%m-%d", errors="coerce")
    btt_df_all_filled.append(test)

In [85]:
btt_df_all2 = pd.concat(btt_df_all_filled, ignore_index=True)

---

---

# Aktivite Datası İçin Ürün Kod Eşleme

---

---

# Pasifik Aktivite

## Left join ile güncel kodlar getirildi. Delist olan ürünler listeden çıkartıldı. "Çeyrek" sütunu silindi. En güncel kod sütunnuda bulunamayan değerler Ürün Kodu sütunundan çekildi.

In [86]:
pasifik_aktivite_df2 = pd.merge(pasifik_aktivite_df, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], on="Ürün Kodu", how="left")
pasifik_aktivite_df2 = pasifik_aktivite_df2[pasifik_aktivite_df2["En Güncel Kod"] != "delist"].reset_index(drop=True)
pasifik_aktivite_df2.drop("Çeyrek", inplace=True, axis=1)
pasifik_aktivite_df2['En Güncel Kod'] = pasifik_aktivite_df2['En Güncel Kod'].fillna(pasifik_aktivite_df2['Ürün Kodu'])
pasifik_aktivite_df2.drop(columns="Ürün Kodu", axis=1, inplace=True)
pasifik_aktivite_df2.to_csv("../data/_pas_akt_data.csv", index=False)

## Hangi güncel ürün kodundan kaç tane girildiğinin kontrolü

## Duplike durumdaki ürün kodlarının excel olarak dışarıya alınması

In [87]:
x = pasifik_aktivite_df2.columns.to_list()[:5]
y = pasifik_aktivite_df2.columns.to_list()[-1]
x.append(y)
pasifik_aktivite_df2[pasifik_aktivite_df2[x].duplicated(keep=False)].sort_values(by=["En Güncel Kod", "Yıl", "Ay", "Müşteri Grup", "Ana Kategori Adı", "Kategori Adı"]).to_excel("../reports/duplike_pasifik_aktivite_datasi.xlsx", index=False)

---
## Aynı anda farklı iki aktivite tipi var mı?
---

In [88]:
# pa_df = pasifik aktivite df (sadece aynı ay farklı aktivite tipini görmek için)
pa_df = pasifik_aktivite_df2.copy()

pa_df.drop(columns=["Ana Kategori Adı", "Kategori Adı", "Marka Adı", "Ürün Adı"], axis=1, inplace=True)
pa_df.drop_duplicates(subset=pa_df.columns.to_list(), inplace=True, ignore_index=True)
check_pa_df = pa_df.pivot_table(index=["Yıl", "Ay", "En Güncel Kod"], columns="Aktivite Tipi", aggfunc=lambda x: len(x.unique())).sum(axis=1).reset_index()
check_pa_df = check_pa_df[check_pa_df[0] > 1].reset_index(drop=True)

In [89]:
"""for row in range(len(check_pa_df)):
    print("\n")
    print(pa_df[(pa_df["Yıl"] == check_pa_df.loc[row, "Yıl"]) & (pa_df["Ay"] == check_pa_df.loc[row, "Ay"]) & (pa_df["En Güncel Kod"] == check_pa_df.loc[row, "En Güncel Kod"])])
    print("\n")"""

'for row in range(len(check_pa_df)):\n    print("\n")\n    print(pa_df[(pa_df["Yıl"] == check_pa_df.loc[row, "Yıl"]) & (pa_df["Ay"] == check_pa_df.loc[row, "Ay"]) & (pa_df["En Güncel Kod"] == check_pa_df.loc[row, "En Güncel Kod"])])\n    print("\n")'

---

---

---

# Pasifik Aktivite Ciro - Promosyon Tutarı ve İskonto Tekilleştirme (ORTALAMA ALARAK)

In [90]:
ort_pas = {"Raf Tavsiye Satış Fiyatı": "mean", "İndirimli Raf Satış Fiyatı": "mean", "İndirim %": "mean", "Aktivite Tipi": "first"}
pasifik_aktivite_df3 = pasifik_aktivite_df2.groupby(["En Güncel Kod", "Yıl", "Ay", "Müşteri Grup"]).agg(ort_pas).reset_index()
pasifik_aktivite_df3 = pd.merge(pasifik_aktivite_df3, pasifik_aktivite_df2[["Yıl", "Ay", "Müşteri Grup", "En Güncel Kod", 
                                                 "Ana Kategori Adı", "Kategori Adı", "Marka Adı"]],
                           how="left", 
                           on=["En Güncel Kod", "Yıl", "Ay", "Müşteri Grup"])

pasifik_aktivite_df3.drop_duplicates(subset=pasifik_aktivite_df3.columns.to_list(), inplace=True)

In [91]:
pasifik_aktivite_df3.reset_index(drop=True, inplace=True)
pasifik_aktivite_df3 = pasifik_aktivite_df3[pasifik_aktivite_df2.drop("Ürün Adı", axis=1).columns.to_list()]

In [92]:
x = pasifik_aktivite_df3.columns.to_list()[:5]
y = pasifik_aktivite_df3.columns.to_list()[-2:]
x.extend(y)
#pasifik_aktivite_df3[pasifik_aktivite_df3[x].duplicated(keep=False)].sort_values(by=["En Güncel Kod", "Yıl", "Ay", "Müşteri Grup", "Ana Kategori Adı", "Kategori Adı"]).to_excel("../reports/duplike_pasifik_aktivite_datasi.xlsx", index=False)

---

---

---

# Horizon Aktivite

In [93]:
saha_aktivite_detay2 = pd.merge(saha_aktivite_detay, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], on="Ürün Kodu", how="left")
saha_aktivite_detay2 = saha_aktivite_detay2[saha_aktivite_detay2["En Güncel Kod"] != "delist"].reset_index(drop=True)
saha_aktivite_detay2.drop("Çeyrek", inplace=True, axis=1)
saha_aktivite_detay2['En Güncel Kod'] = saha_aktivite_detay2['En Güncel Kod'].fillna(saha_aktivite_detay2['Ürün Kodu'])
saha_aktivite_detay2.drop(columns="Ürün Kodu", axis=1, inplace=True)
saha_aktivite_detay2["İskonto %"].replace("#DIV/0", np.nan,inplace=True)
saha_aktivite_detay2.to_csv("../data/_saha_akt_data.csv", index=False)

In [94]:
x = saha_aktivite_detay2.columns.to_list()[:5]
y = saha_aktivite_detay2.columns.to_list()[-1]
x.append(y)
saha_aktivite_detay2[saha_aktivite_detay2[x].duplicated(keep=False)].sort_values(by=["En Güncel Kod", "Yıl", "Ay", "Saha Müşteri Grup", "Ana Kategori Adı", "Kategori Adı"]).to_excel("../reports/duplike_saha_aktivite_datasi.xlsx", index=False)

# Horizon Aktivite Ciro - Promosyon Tutarı ve İskonto Tekilleştirme (ORTALAMA ALARAK)

In [95]:
ort = {"Ciro (Kull. İade Düş.)": "mean", "Promosyon Tutarı": "mean", "İskonto %": "mean"}
saha_aktivite_detay3 = saha_aktivite_detay2.groupby(["En Güncel Kod", "Yıl", "Ay", "Saha Müşteri Grup"]).agg(ort).reset_index()

saha_aktivite_detay3 = pd.merge(saha_aktivite_detay3, saha_aktivite_detay2[["Yıl", "Ay", "Saha Müşteri Grup", "En Güncel Kod", 
                                                 "Ana Kategori Adı", "Kategori Adı", "Marka Adı"]],
                           how="left", 
                           on=["En Güncel Kod", "Yıl", "Ay", "Saha Müşteri Grup"])

saha_aktivite_detay3.drop_duplicates(subset=saha_aktivite_detay3.columns.to_list(), inplace=True)

In [96]:
saha_aktivite_detay3 = saha_aktivite_detay3[saha_aktivite_detay2.drop("Ürün Adı (Mobis)", axis=1).columns.to_list()].reset_index(drop=True)

In [97]:
x = saha_aktivite_detay3.columns.to_list()[:5]
y = saha_aktivite_detay3.columns.to_list()[-1]
x.append(y)
#saha_aktivite_detay3[saha_aktivite_detay3[x].duplicated(keep=False)].sort_values(by=["En Güncel Kod", "Yıl", "Ay", "Saha Müşteri Grup", "Ana Kategori Adı", "Kategori Adı"]).to_excel("../reports/duplike_saha_aktivite_datasi.xlsx", index=False)

In [98]:
saha_aktivite_detay3.rename(columns={"Saha Müşteri Grup": "Grup adı"}, inplace=True)
saha_aktivite_detay3["Grup adı"] = saha_aktivite_detay3["Grup adı"].apply(lambda x: "Diğer_Horizon" if x == "Diğer" else x)

---

---

---

# Fiyat Listesi

## Horizon Fiyatları
---

In [99]:
fiyat_lst_horizon["Malzeme"] = fiyat_lst_horizon["Malzeme"].str.replace("-", "")
fiyat_lst_horizon["Malzeme"] = fiyat_lst_horizon["Malzeme"].astype(int)*1

In [100]:
fiyat_lst_horizon_df = fiyat_lst_horizon.copy()

In [101]:
fiyat_lst_horizon_df["Baslangic_Yıl"] = fiyat_lst_horizon_df["Bşl.tarihi"].apply(lambda x: x.year)
fiyat_lst_horizon_df["Baslangic_Ay"] = fiyat_lst_horizon_df["Bşl.tarihi"].apply(lambda x: x.month)
fiyat_lst_horizon_df["Baslangic_Gun"] = fiyat_lst_horizon_df["Bşl.tarihi"].apply(lambda x: x.day)
fiyat_lst_horizon_df["Gecerlilik_Yıl"] = fiyat_lst_horizon_df["Gçrl.sonu"].apply(lambda x: x.year)
fiyat_lst_horizon_df["Gecerlilik_Ay"] = fiyat_lst_horizon_df["Gçrl.sonu"].apply(lambda x: x.month)
fiyat_lst_horizon_df["Gecerlilik_Gun"] = fiyat_lst_horizon_df["Gçrl.sonu"].apply(lambda x: x.day)

In [102]:
fiyat_lst_horizon_df["Baslangic_Yıl"] = fiyat_lst_horizon_df["Baslangic_Yıl"].apply(lambda x: 2022 if x > 2021 else x)
fiyat_lst_horizon_df["Gecerlilik_Yıl"] = fiyat_lst_horizon_df["Gecerlilik_Yıl"].apply(lambda x: 2022 if x > 2021 else x)

In [103]:
time_index = horizon_saha_df_all2["Date"].unique()

In [104]:
h_fiyat_unique = []

for malzeme in fiyat_lst_horizon_df["Malzeme"].unique():
    temp_time_df = pd.DataFrame({"Fiyat": [np.nan]}, index=time_index)
    temp_time_df = temp_time_df.reset_index().rename(columns={"index":"date"})    
    temp_time_df["En Güncel Kod"] = malzeme
    temp_time_df["fiyat_gecisi"] = 0
    malzeme_df = fiyat_lst_horizon_df[fiyat_lst_horizon_df["Malzeme"] == malzeme].reset_index(drop=True)
    check_idx1 = []
    for row1 in malzeme_df.index:
        for row2 in malzeme_df[row1+1:].index:
            if (malzeme_df.loc[row1]["Gecerlilik_Yıl"] == malzeme_df.loc[row2]["Baslangic_Yıl"]) and (malzeme_df.loc[row1]["Gecerlilik_Ay"] == malzeme_df.loc[row2]["Baslangic_Ay"]):
                num_days = calendar.monthrange(int(malzeme_df.loc[row2]["Baslangic_Yıl"]), int(malzeme_df.loc[row2]["Baslangic_Ay"]))[1]
                fyt=((int(malzeme_df.loc[row1]["Gecerlilik_Gun"])*malzeme_df.loc[row1]["     Tutar"]) + (num_days - int(malzeme_df.loc[row2]["Baslangic_Gun"]))*malzeme_df.loc[row2]["     Tutar"])/num_days

                end_idx1 =  datetime(int(malzeme_df.loc[row1, "Gecerlilik_Yıl"]), int(malzeme_df.loc[row1, "Gecerlilik_Ay"]), 1)
                final_idx1 = temp_time_df[temp_time_df["date"] == end_idx1].index
                temp_time_df.loc[final_idx1, "Fiyat"] = fyt
                temp_time_df.loc[final_idx1,"fiyat_gecisi"] = 1

            else:
                fyt2=malzeme_df.loc[row1]["     Tutar"]
                start_idx2 = datetime(int(malzeme_df.loc[row1, "Baslangic_Yıl"]), int(malzeme_df.loc[row1, "Baslangic_Ay"]), 1)
                end_idx2 =  datetime(int(malzeme_df.loc[row1, "Gecerlilik_Yıl"]), int(malzeme_df.loc[row1, "Gecerlilik_Ay"]), 1)
                final_idx2 = temp_time_df[(temp_time_df["date"] > start_idx2) & (temp_time_df["date"] < end_idx2)].index
                temp_time_df.loc[final_idx2, "Fiyat"] = fyt2
        if (row1 == len(malzeme_df)-1) or (row1 == len(malzeme_df)-2):
            fyt3=malzeme_df.loc[row1]["     Tutar"]
            start_idx3 = datetime(int(malzeme_df.loc[row1, "Baslangic_Yıl"]), int(malzeme_df.loc[row1, "Baslangic_Ay"]), 1)
            end_idx3 =  datetime(int(malzeme_df.loc[row1, "Gecerlilik_Yıl"]), int(malzeme_df.loc[row1, "Gecerlilik_Ay"]), 1)
            final_idx3 = temp_time_df[(temp_time_df["date"] > start_idx3) & (temp_time_df["date"] < end_idx3)].index
            temp_time_df.loc[final_idx3, "Fiyat"] = fyt3
    if malzeme_df.loc[0, "Baslangic_Yıl"] >= min(horizon_saha_df_all2["Yıl"].unique()):
        temp_time_df.loc[temp_time_df[~pd.isnull(temp_time_df["Fiyat"])].index[0]-1, "Fiyat"] = malzeme_df.loc[0, "     Tutar"]
        temp_time_df = temp_time_df.dropna().reset_index(drop=True)
    h_fiyat_unique.append(temp_time_df)

In [105]:
h_fiyat_unique = pd.concat(h_fiyat_unique)
h_fiyat_unique.reset_index(drop=True, inplace=True)

h_fiyat_unique.rename(columns={"En Güncel Kod": "Ürün Kodu", "date": "Date"}, inplace=True)
h_fiyat_unique = h_fiyat_unique.merge(eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], how="left")
h_fiyat_unique["En Güncel Kod"].fillna(h_fiyat_unique["Ürün Kodu"], inplace=True)

# Fiyatların en güncel kod ile check edilmesi

In [106]:
h_fiyat_unique = h_fiyat_unique[h_fiyat_unique["En Güncel Kod"] != "delist"].reset_index(drop=True)

h_fiyat_unique = h_fiyat_unique.sort_values(by=["En Güncel Kod", "Date"]).reset_index(drop=True)
drop_rows_h = h_fiyat_unique[h_fiyat_unique[["Date", "En Güncel Kod", "Fiyat"]].duplicated(keep=False)].index

export_h = h_fiyat_unique[~h_fiyat_unique.index.isin(drop_rows_h)].reset_index(drop=True)
export_h[export_h[["En Güncel Kod", "Date"]].duplicated(keep=False)].to_excel("../reports/horizon_fiyat_eslestirme.xlsx", index=False)

In [107]:
h_fiyat_unique = h_fiyat_unique.drop(columns="Ürün Kodu", axis=1)
# Aynı aya denk gelen ürünlerin fiyatlarının ortalaması alınıp, herhangi birinde fiyat geçişi varsa 1 alınır.
h_fiyat_unique = h_fiyat_unique.groupby(["Date", "En Güncel Kod"]).agg({"Fiyat": "mean", "fiyat_gecisi": "max"}).reset_index()

## Pasifik Fiyatları
---

In [108]:
fiyat_lst_pasifik["Malzeme"] = fiyat_lst_pasifik["Malzeme"].str.replace("-", "")
fiyat_lst_pasifik["Malzeme"] = fiyat_lst_pasifik["Malzeme"].astype(int)*1

In [109]:
fiyat_lst_pasifik_df = fiyat_lst_pasifik.copy()

In [110]:
fiyat_lst_pasifik_df["Baslangic_Yıl"] = fiyat_lst_pasifik_df["Bşl.tarihi"].apply(lambda x: x.year)
fiyat_lst_pasifik_df["Baslangic_Ay"] = fiyat_lst_pasifik_df["Bşl.tarihi"].apply(lambda x: x.month)
fiyat_lst_pasifik_df["Baslangic_Gun"] = fiyat_lst_pasifik_df["Bşl.tarihi"].apply(lambda x: x.day)
fiyat_lst_pasifik_df["Gecerlilik_Yıl"] = fiyat_lst_pasifik_df["Gçrl.sonu"].apply(lambda x: x.year)
fiyat_lst_pasifik_df["Gecerlilik_Ay"] = fiyat_lst_pasifik_df["Gçrl.sonu"].apply(lambda x: x.month)
fiyat_lst_pasifik_df["Gecerlilik_Gun"] = fiyat_lst_pasifik_df["Gçrl.sonu"].apply(lambda x: x.day)

In [111]:
fiyat_lst_pasifik_df["Baslangic_Yıl"] = fiyat_lst_pasifik_df["Baslangic_Yıl"].apply(lambda x: 2022 if x > 2021 else x)
fiyat_lst_pasifik_df["Gecerlilik_Yıl"] = fiyat_lst_pasifik_df["Gecerlilik_Yıl"].apply(lambda x: 2022 if x > 2021 else x)

In [112]:
time_index = pasifik_df_all2["Date"].unique()

In [113]:
malzeme

878006

In [114]:
fiyat_lst_pasifik_df[fiyat_lst_pasifik_df["Malzeme"] == malzeme]

Unnamed: 0,KşTü,KşTü.1,Malzeme,Malzeme Tanım,Ana Kategori,Kategori,Koli TL,Bşl.tarihi,Gçrl.sonu,Baslangic_Yıl,Baslangic_Ay,Baslangic_Gun,Gecerlilik_Yıl,Gecerlilik_Ay,Gecerlilik_Gun


In [115]:
pd.Series(fiyat_lst_pasifik_df["Malzeme"].unique())[pd.Series(fiyat_lst_pasifik_df["Malzeme"].unique()) == malzeme]

Series([], dtype: int32)

In [117]:
malzeme

3606

In [116]:
p_fiyat_unique = []

for malzeme in fiyat_lst_pasifik_df["Malzeme"].unique():
    temp_time_df = pd.DataFrame({"Fiyat": [np.nan]}, index=time_index)
    temp_time_df = temp_time_df.reset_index().rename(columns={"index":"date"})    
    temp_time_df["En Güncel Kod"] = malzeme
    temp_time_df["fiyat_gecisi"] = 0
    malzeme_df = fiyat_lst_pasifik_df[fiyat_lst_pasifik_df["Malzeme"] == malzeme].reset_index(drop=True)
    check_idx1 = []
    for row1 in malzeme_df.index:
        for row2 in malzeme_df[row1+1:].index:
            if (malzeme_df.loc[row1]["Gecerlilik_Yıl"] == malzeme_df.loc[row2]["Baslangic_Yıl"]) and (malzeme_df.loc[row1]["Gecerlilik_Ay"] == malzeme_df.loc[row2]["Baslangic_Ay"]):
                num_days = calendar.monthrange(int(malzeme_df.loc[row2]["Baslangic_Yıl"]), int(malzeme_df.loc[row2]["Baslangic_Ay"]))[1]
                fyt=((int(malzeme_df.loc[row1]["Gecerlilik_Gun"])*malzeme_df.loc[row1]["Koli TL"]) + (num_days - int(malzeme_df.loc[row2]["Baslangic_Gun"])+1)*malzeme_df.loc[row2]["Koli TL"])/num_days

                end_idx1 =  datetime(int(malzeme_df.loc[row1, "Gecerlilik_Yıl"]), int(malzeme_df.loc[row1, "Gecerlilik_Ay"]), 1)
                final_idx1 = temp_time_df[temp_time_df["date"] == end_idx1].index
                temp_time_df.loc[final_idx1, "Fiyat"] = fyt
                temp_time_df.loc[final_idx1,"fiyat_gecisi"] = 1

            else:
                fyt2=malzeme_df.loc[row1]["Koli TL"]
                start_idx2 = datetime(int(malzeme_df.loc[row1, "Baslangic_Yıl"]), int(malzeme_df.loc[row1, "Baslangic_Ay"]), 1)
                end_idx2 =  datetime(int(malzeme_df.loc[row1, "Gecerlilik_Yıl"]), int(malzeme_df.loc[row1, "Gecerlilik_Ay"]), 1)
                final_idx2 = temp_time_df[(temp_time_df["date"] > start_idx2) & (temp_time_df["date"] < end_idx2)].index
                temp_time_df.loc[final_idx2, "Fiyat"] = fyt2
        if (row1 == len(malzeme_df)-1) or (row1 == len(malzeme_df)-2):
            fyt3=malzeme_df.loc[row1]["Koli TL"]
            start_idx3 = datetime(int(malzeme_df.loc[row1, "Baslangic_Yıl"]), int(malzeme_df.loc[row1, "Baslangic_Ay"]), 1)
            end_idx3 =  datetime(int(malzeme_df.loc[row1, "Gecerlilik_Yıl"]), int(malzeme_df.loc[row1, "Gecerlilik_Ay"]), 1)
            final_idx3 = temp_time_df[(temp_time_df["date"] > start_idx3) & (temp_time_df["date"] < end_idx3)].index
            temp_time_df.loc[final_idx3, "Fiyat"] = fyt3
    if malzeme_df.loc[0, "Baslangic_Yıl"] >= min(pasifik_df_all2["Yıl"].unique()):
        temp_time_df.loc[temp_time_df[~pd.isnull(temp_time_df["Fiyat"])].index[0]-1, "Fiyat"] = malzeme_df.loc[0, "Koli TL"]
    temp_time_df = temp_time_df.dropna().reset_index(drop=True)
        
    p_fiyat_unique.append(temp_time_df)

IndexError: index 0 is out of bounds for axis 0 with size 0

In [None]:
p_fiyat_unique = pd.concat(p_fiyat_unique)
p_fiyat_unique.reset_index(drop=True, inplace=True)

p_fiyat_unique.rename(columns={"En Güncel Kod": "Ürün Kodu", "date": "Date"}, inplace=True)
p_fiyat_unique = p_fiyat_unique.merge(eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], how="left")
p_fiyat_unique["En Güncel Kod"].fillna(p_fiyat_unique["Ürün Kodu"], inplace=True)

# p_fiyat_uniqueların en güncel kod ile check edilmesi

In [None]:
p_fiyat_unique = p_fiyat_unique[p_fiyat_unique["En Güncel Kod"] != "delist"].reset_index(drop=True)

p_fiyat_unique = p_fiyat_unique.sort_values(by=["En Güncel Kod", "Date"]).reset_index(drop=True)
drop_rows_p = p_fiyat_unique[p_fiyat_unique[["Date", "En Güncel Kod", "Fiyat"]].duplicated(keep=False)].index

export_p = p_fiyat_unique[~p_fiyat_unique.index.isin(drop_rows_p)].reset_index(drop=True)
export_p[export_p[["En Güncel Kod", "Date"]].duplicated(keep=False)].to_excel("../reports/pasifik_fiyat_eslestirme.xlsx", index=False)

In [None]:
# Dosya ile karşılaştır. Ortalama almanı gerektirecek durumları düşün.

In [None]:
p_fiyat_unique = p_fiyat_unique.drop(columns="Ürün Kodu", axis=1)
# Aynı aya denk gelen ürünlerin fiyatlarının ortalaması alınıp, herhangi birinde fiyat geçişi varsa 1 alınır.
p_fiyat_unique = p_fiyat_unique.groupby(["Date", "En Güncel Kod"]).agg({"Fiyat": "mean", "fiyat_gecisi": "max"}).reset_index()

---
# 0'ları doldururken en son yıl ve ayın ötesinde 0 ile dolduruyor. (Örn: Sales datasında 2021'in 3. ayına kadar data olduğu durumda 0'lar ile doldururken 2021 12. aya kadar 0 atıyor.
# Bu durumun önüne geçmek için aşağıdaki işlemler yapılmaktadır.
---

In [None]:
pasifik_df_all2 = pasifik_df_all2[~((pasifik_df_all2["Yıl"] == pasifik_df_all["Yıl"].max()) & 
                (pasifik_df_all2["Ay"] > pasifik_df_all[(pasifik_df_all["Yıl"] == pasifik_df_all["Yıl"].max())]["Ay"].max()))].reset_index(drop=True)

In [None]:
horizon_saha_df_all2 = horizon_saha_df_all2[~((horizon_saha_df_all2["Yıl"] == horizon_saha_df_all["Yıl"].max()) & 
                (horizon_saha_df_all2["Ay"] > horizon_saha_df_all[(horizon_saha_df_all["Yıl"] == horizon_saha_df_all["Yıl"].max())]["Ay"].max()))].reset_index(drop=True)

In [None]:
btt_df_all2 = btt_df_all2[~((btt_df_all2["Yıl"] == btt_df_all["Yıl"].max()) & 
                (btt_df_all2["Ay"] > btt_df_all[(btt_df_all["Yıl"] == btt_df_all["Yıl"].max())]["Ay"].max()))].reset_index(drop=True)

In [None]:
pasifik_df_all2.shape, horizon_saha_df_all2.shape, btt_df_all2.shape

In [45]:
pasifik_df_all2.shape, horizon_saha_df_all2.shape, btt_df_all2.shape

((58236, 14), (116028, 14), (16860, 14))

---

# Fiyat Listesi Kontrolleri

---

## Horizon Fiyat Listesi

## Ürün Kodlarının arasındaki "-" kaldırıldı.

## Horizon Fiyat Çakışmaları

## Pasifik Fiyat Çakışmaları

---

---

# Portföy

---

---

## Pasifik Portföy

In [None]:
pasifik_portfoy_df2 = pd.merge(pasifik_portfoy_df, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], how="left", left_on="Kod", right_on="Ürün Kodu")
pasifik_portfoy_df2["En Güncel Kod"] = pasifik_portfoy_df2["En Güncel Kod"].fillna(pasifik_portfoy_df2["Kod"])
pasifik_portfoy_df2.drop("Ürün Kodu", axis=1, inplace=True)
pasifik_portfoy_df2 = pasifik_portfoy_df2[pasifik_portfoy_df2["En Güncel Kod"] != "delist"].reset_index(drop=True)
pasifik_portfoy_df2["Portfoy"] = 1

## Horizon Portföy

In [None]:
horizon_portfoy_df2 = pd.merge(horizon_portfoy_df, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], how="left", left_on="Kod", right_on="Ürün Kodu")
horizon_portfoy_df2["En Güncel Kod"] = horizon_portfoy_df2["En Güncel Kod"].fillna(horizon_portfoy_df2["Kod"])
horizon_portfoy_df2.drop("Ürün Kodu", axis=1, inplace=True)
horizon_portfoy_df2 = horizon_portfoy_df2[horizon_portfoy_df2["En Güncel Kod"] != "delist"].reset_index(drop=True)
horizon_portfoy_df2["Portfoy"] = 1

In [None]:
horizon_portfoy_df2 = horizon_portfoy_df2[~((horizon_portfoy_df2["Kod"] == 135901))]

## BTT Portföy

In [None]:
btt_portfoy_df2 = pd.merge(btt_portfoy_df, eslenik_kod_df[["Ürün Kodu", "En Güncel Kod"]], how="left", left_on="Kod", right_on="Ürün Kodu")
btt_portfoy_df2["En Güncel Kod"] = btt_portfoy_df2["En Güncel Kod"].fillna(btt_portfoy_df2["Kod"])
btt_portfoy_df2.drop("Ürün Kodu", axis=1, inplace=True)
btt_portfoy_df2 = btt_portfoy_df2[btt_portfoy_df2["En Güncel Kod"] != "delist"].reset_index(drop=True)
btt_portfoy_df2["Portfoy"] = 1

In [None]:
btt_portfoy_df2 = btt_portfoy_df2[~((btt_portfoy_df2["Kod"] == 135901))]

---

---

# Portföy Kapsamındaki Sales Dataları

---

---

In [None]:
pasifik_df_all3 = pd.merge(pasifik_df_all2,pasifik_portfoy_df2[["En Güncel Kod", "Portfoy"]], on="En Güncel Kod", how="left")
btt_df_all3 = pd.merge(btt_df_all2,btt_portfoy_df2[["En Güncel Kod", "Portfoy"]], on="En Güncel Kod", how="left")
horizon_saha_df_all3 = pd.merge(horizon_saha_df_all2,horizon_portfoy_df2[["En Güncel Kod", "Portfoy"]], on="En Güncel Kod", how="left")

In [None]:
pasifik_df_all3["Portfoy"].fillna(0, inplace=True)
btt_df_all3["Portfoy"].fillna(0, inplace=True)
horizon_saha_df_all3["Portfoy"].fillna(0, inplace=True)

---
# Datalara Calender Eklenmesi
---

In [None]:
calender_df.pop("DATE")

In [None]:
pasifik_df_all3 = pd.merge(pasifik_df_all3, calender_df, on=["Yıl", "Ay"], how="left")
btt_df_all3 = pd.merge(btt_df_all3, calender_df, on=["Yıl", "Ay"], how="left")
horizon_saha_df_all3 = pd.merge(horizon_saha_df_all3, calender_df, on=["Yıl", "Ay"], how="left")

In [None]:
"""dates_ = pasifik_df_all3[["Yıl", "Ay"]].drop_duplicates(subset=["Yıl", "Ay"]).reset_index(drop=True)


if dates_["Ay"][len(dates_) - 1] == 12:
    dates_ = dates_.append({"Yıl": dates_["Yıl"][len(dates_) - 1] + 1, "Ay": 1}, ignore_index=True)
else:
    dates_ = dates_.append({"Yıl": dates_["Yıl"][len(dates_) - 1], "Ay": dates_["Ay"][len(dates_) - 1] + 1}, ignore_index=True)

    
    dates_["Ay"] = dates_["Ay"].apply(lambda x: "0"+str(x) if x < 10 else str(x))
dates_["Date"] = dates_["Yıl"].astype(str) + "-" + dates_["Ay"].astype(str)"""

In [None]:
"""dates_["Weekdays"] = 0
dates_["Weekends"] = 0
for row in range(len(dates_) - 1):
    dates_["Weekdays"][row] = np.busday_count(begindates=dates_["Date"][row], enddates=dates_["Date"][row+1],weekmask="1111100")
    dates_["Weekends"][row] = np.busday_count(begindates=dates_["Date"][row], enddates=dates_["Date"][row+1],weekmask="0000011")"""

In [None]:
"""dates_["Yıl"], dates_["Ay"], dates_["Date"] = dates_["Yıl"].astype(int), dates_["Ay"].astype(int), pd.to_datetime(dates_["Date"])"""

---
# Dataların Fiyat Ve Aktiviteler İle Birleştirilmesi
---

# Not:
---
### 1) BTT aktivite verisi için Horizon kısmındaki "Geleneksel Kanal" kullanılması istendi.
### 2) BTT fiyat geçişleri için Horizon fiyat geçişleri baz alındı.

In [None]:
pasifik_df_all3 = pasifik_df_all3.merge(p_fiyat_unique, how="left", on=["Date", "En Güncel Kod"])

In [None]:
pasifik_aktivite_df3.rename(columns={"Müşteri Grup": "Grup adı"}, inplace=True)
pasifik_df_all3 = pd.merge(pasifik_df_all3, pasifik_aktivite_df3[["Yıl", "Ay", "Grup adı", "En Güncel Kod", 
                                                "Raf Tavsiye Satış Fiyatı", "İndirimli Raf Satış Fiyatı", "İndirim %",
                                               "Aktivite Tipi"]], 
         left_on=["Yıl", "Ay", "Grup adı", "En Güncel Kod"], 
         right_on=["Yıl", "Ay", "Grup adı", "En Güncel Kod"], how="left")

In [None]:
horizon_saha_df_all3 = horizon_saha_df_all3.merge(h_fiyat_unique, how="left", on=["Date", "En Güncel Kod"])

In [None]:
horizon_saha_df_all3 = horizon_saha_df_all3.merge(saha_aktivite_detay3[['Ciro (Kull. İade Düş.)', 'Promosyon Tutarı', 
                                                'İskonto %', 'En Güncel Kod', "Yıl", "Ay", "Grup adı"]],
                          on=["En Güncel Kod", "Yıl", "Ay", "Grup adı"], how="left")

In [None]:
btt_df_all3 = btt_df_all3.merge(h_fiyat_unique, how="left", on=["Date", "En Güncel Kod"])

In [None]:
btt_aktivite = saha_aktivite_detay3[saha_aktivite_detay3["Grup adı"] == "GELENEKSEL KANAL"].reset_index(drop=True)

btt_df_all3 = btt_df_all3.merge(btt_aktivite[['Ciro (Kull. İade Düş.)', 'Promosyon Tutarı', 
                                                'İskonto %', 'En Güncel Kod', "Yıl", "Ay", "Grup adı"]],
                          on=["En Güncel Kod", "Yıl", "Ay", "Grup adı"], how="left")

---
# SKU Bazında İncelemeler
---

In [None]:
sku = pd.concat([pasifik_df_all3[["Grup adı", "En Güncel Kod", "Portfoy"]], 
                 btt_df_all3[["Grup adı", "En Güncel Kod", "Portfoy"]], 
                 horizon_saha_df_all3[["Grup adı", "En Güncel Kod", "Portfoy"]]], axis=0, ignore_index=True)


only_sku = pd.concat([pasifik_df_all3["En Güncel Kod"], btt_df_all3["En Güncel Kod"], horizon_saha_df_all3["En Güncel Kod"]], 
                    axis=0, ignore_index=True)


kategori_all = pd.concat([pasifik_df_all3["Kategori Adı"], 
                 btt_df_all3["Kategori Adı"],
                 horizon_saha_df_all3["Kategori Adı"]], axis=0, ignore_index=True)


kategori_kanal = pd.concat([pasifik_df_all3[["Grup adı", "Kategori Adı"]], 
                 btt_df_all3[["Grup adı", "Kategori Adı"]],
                 horizon_saha_df_all3[["Grup adı", "Kategori Adı"]]], axis=0, ignore_index=True).drop_duplicates(subset=["Grup adı", "Kategori Adı"]).reset_index(drop=True)


only_sku = only_sku.drop_duplicates().sort_values().reset_index(drop=True)
sku = sku.drop_duplicates(subset=sku.columns.to_list()).sort_values(by=sku.columns.to_list()).reset_index(drop=True)
kategori_all = kategori_all.drop_duplicates().sort_values().reset_index(drop=True)
kategori_kanal = kategori_kanal.sort_values(by=kategori_kanal.columns.to_list()).reset_index(drop=True)

kategori_bazli_urun_sayilari = pd.concat([pasifik_df_all3[["Grup adı", "Kategori Adı", "En Güncel Kod"]], 
                 btt_df_all3[["Grup adı", "Kategori Adı", "En Güncel Kod"]],
                 horizon_saha_df_all3[["Grup adı", "Kategori Adı", "En Güncel Kod"]]], 
                           axis=0, ignore_index=True).drop_duplicates(subset=["Grup adı", 
                                                                              "Kategori Adı", 
                                                                              "En Güncel Kod"]).sort_values(by=["Grup adı", 
                                                                                                                "Kategori Adı", 
                                                                                                                "En Güncel Kod"]).reset_index(drop=True)

kategori_bazli_urun_sayilari = kategori_bazli_urun_sayilari.groupby(["Grup adı", "Kategori Adı"]).agg("count").reset_index()


writer_sku = pd.ExcelWriter("../reports/SKU_kodlari.xlsx", engine = 'xlsxwriter')

only_sku.to_excel(writer_sku, sheet_name='tum_sku', index=False)
sku.to_excel(writer_sku, sheet_name='grup_adina_gore_sku', index=False)
kategori_all.to_excel(writer_sku, sheet_name='kategori_tumu', index=False)
kategori_kanal.to_excel(writer_sku, sheet_name='kategori_kanallara_gore', index=False)
kategori_bazli_urun_sayilari.to_excel(writer_sku, sheet_name='kanal_kat_gore_sku_sayilari', index=False)


writer_sku.save()
writer_sku.close()

---

---

# Eşlenik Kod (En Güncel Kod) kısmında yer almayan Ürün Kod'ları

---

---

In [None]:
diff_pasifik = list(set(eslenik_kod_df["En Güncel Kod"].unique()) - set(pasifik_df_all3["En Güncel Kod"].unique()))
diff_btt = list(set(eslenik_kod_df["En Güncel Kod"].unique()) - set(btt_df_all3["En Güncel Kod"].unique()))
diff_horizon = list(set(eslenik_kod_df["En Güncel Kod"].unique()) - set(horizon_saha_df_all3["En Güncel Kod"].unique()))

diff_pasifik = pd.DataFrame({"En Güncel Kod": diff_pasifik, "Kanal": ["Pasifik"]*len(diff_pasifik)})
diff_btt = pd.DataFrame({"En Güncel Kod": diff_btt, "Kanal": ["BTT"]*len(diff_btt)})
diff_horizon = pd.DataFrame({"En Güncel Kod": diff_horizon, "Kanal": ["Horizon"]*len(diff_horizon)})

pd.concat([diff_pasifik, diff_btt, diff_horizon], axis=0, ignore_index=True).to_excel("../reports/urun_kodu_historik_datada_olmayan_sku.xlsx", index=False)

---

---

# Fiyat Geçiş Bilgisi Verilmeyen SKU'lar

In [None]:
p_fiyat_yok = pasifik_df_all3[pd.isnull(pasifik_df_all3["Fiyat"])][["En Güncel Kod", "Date"]].drop_duplicates().reset_index(drop=True)
p_fiyat_yok["Kanal"] = "Pasifik"
p_fiyat_yok.sort_values(by=["En Güncel Kod", "Date"], ignore_index=True, inplace=True)

In [None]:
h_fiyat_yok = horizon_saha_df_all3[pd.isnull(horizon_saha_df_all3["Fiyat"])][["En Güncel Kod", "Date"]].drop_duplicates().reset_index(drop=True)
h_fiyat_yok["Kanal"] = "Horizon"
h_fiyat_yok.sort_values(by=["En Güncel Kod", "Date"], ignore_index=True, inplace=True)

In [None]:
"""p_fiyat_yok = pasifik_df_all3[pd.isnull(pasifik_df_all3["fiyat"])][["en_guncel_kod", "date"]].drop_duplicates().reset_index(drop=True)
p_fiyat_yok["Kanal"] = "Pasifik"
p_fiyat_yok.sort_values(by=["en_guncel_kod", "date"], ignore_index=True, inplace=True)"""

In [None]:
"""h_fiyat_yok = horizon_saha_df_all3[pd.isnull(horizon_saha_df_all3["fiyat"])][["en_guncel_kod", "date"]].drop_duplicates().reset_index(drop=True)
h_fiyat_yok["Kanal"] = "Horizon"
h_fiyat_yok.sort_values(by=["en_guncel_kod", "date"], ignore_index=True, inplace=True)"""

In [None]:
pd.concat([h_fiyat_yok, p_fiyat_yok], axis=0).to_excel("../reports/fiyat_bilgisi_verilmeyen_skular.xlsx", index=False)

# Sütun İsimlerini İngilizce Karaktere Çevirme

In [None]:
chng_letters = list(zip(["ç", "ğ", "ı", "ö", "ş", "ü", " ", "%", ".", "(", ")"], 
                        ["c", "g", "i", "o", "s", "u", "_", "", "", "", ""]))

In [None]:
pasifik_new_cols = []
for col in pasifik_df_all3.columns.str.lower():
    for letter in range(len(chng_letters)):
        col = col.replace(chng_letters[letter][0], chng_letters[letter][1])
        if letter == len(chng_letters) - 1:
            pasifik_new_cols.append(col)
        else:
            pass

In [None]:
btt_new_cols = []
for col in btt_df_all3.columns.str.lower():
    for letter in range(len(chng_letters)):
        col = col.replace(chng_letters[letter][0], chng_letters[letter][1])
        if letter == len(chng_letters) - 1:
            btt_new_cols.append(col)
        else:
            pass

In [None]:
horizon_new_cols = []
for col in horizon_saha_df_all3.columns.str.lower():
    for letter in range(len(chng_letters)):
        col = col.replace(chng_letters[letter][0], chng_letters[letter][1])
        if letter == len(chng_letters) - 1:
            horizon_new_cols.append(col)
        else:
            pass

In [None]:
pasifik_df_all3.columns = pasifik_new_cols

In [None]:
btt_df_all3.columns = btt_new_cols

In [None]:
horizon_saha_df_all3.columns = horizon_new_cols

---
# Pasifikte Aktivite Tipi Verisi Eksik Olan Verilere "Yok" yazıldı
---

In [None]:
pasifik_df_all3["Aktivite Tipi"].fillna("Yok", inplace=True)

---
# Datanın dışarıya aktarılması
---

In [None]:
pasifik_df_all3.to_excel("../data/_pasifik_sales_portfoy.xlsx", index=False)

In [None]:
btt_df_all3.to_excel("../data/_btt_sales_portfoy.xlsx", index=False)

In [None]:
horizon_saha_df_all3.to_excel("../data/_horizon_sales_portfoy.xlsx", index=False)