In [19]:
import pandas as pd
import argparse

# Komut satırı argümanları
parser = argparse.ArgumentParser(description="Ürün özellikleri oluştur.")
parser.add_argument("--min-date", type=str, default="2021-01-08", help="Başlangıç tarihi, format: 'YYYY-MM-DD'")
parser.add_argument("--max-date", type=str, default="2021-05-30", help="Bitiş tarihi, format: 'YYYY-MM-DD'")
args = parser.parse_args()

# Veriyi yükleme
brand_df = pd.read_csv("brand.csv")
product_df = pd.read_csv("product.csv")
store_df = pd.read_csv("store.csv")
sales_df = pd.read_csv("sales.csv")

# brad name ve brand id ile sözlük
brand_name_to_id = dict(zip(brand_df["name"], brand_df["id"]))

# Marka adlarına karşılık gelen brand_id'leri product_df'e ekleme
product_df["brand_id"] = product_df["brand"].map(brand_name_to_id)

# Verileri birleştirme
merged_sales_df = sales_df.merge(product_df, left_on="product", right_on="id")
merged_sales_df = merged_sales_df.merge(store_df, left_on="store", right_on="id")
merged_sales_df = merged_sales_df.merge(brand_df, left_on="brand_id", right_on="id", suffixes=("", "_brand"))

# Tarih sütununu tarih formatına çevirme
merged_sales_df["date"] = pd.to_datetime(merged_sales_df["date"])

# Tarih aralığına göre veriyi filtreleme
filtered_sales_df = merged_sales_df[(merged_sales_df["date"] >= pd.to_datetime(args.min_date)) & (merged_sales_df["date"] <= pd.to_datetime(args.max_date))].copy()

# Ürün özelliklerini hesaplama
filtered_sales_df["MA7_P"] = filtered_sales_df.groupby("product")["quantity"].rolling(window=7, min_periods=1).mean().reset_index(level=0, drop=True)
filtered_sales_df["LAG7_P"] = filtered_sales_df.groupby("product")["quantity"].shift(7)

# Marka özelliklerini hesaplama
filtered_sales_df["MA7_B"] = filtered_sales_df.groupby(["brand_id", "store_id"])["quantity"].rolling(window=7, min_periods=1).mean().reset_index(level=0, drop=True)
filtered_sales_df["LAG7_B"] = filtered_sales_df.groupby(["brand_id", "store_id"])["quantity"].shift(7)

# Mağaza özelliklerini hesaplama
filtered_sales_df["MA7_S"] = filtered_sales_df.groupby("store_id")["quantity"].rolling(window=7, min_periods=1).mean().reset_index(level=0, drop=True)
filtered_sales_df["LAG7_S"] = filtered_sales_df.groupby("store_id")["quantity"].shift(7)

# Sütunları seçme ve yeniden düzenleme
output_columns = [
    "product", "store_id", "brand_id", "date", "quantity",
    "MA7_P", "LAG7_P", "MA7_B", "LAG7_B", "MA7_S", "LAG7_S"
]
output_df = filtered_sales_df[output_columns]

# Çıktıyı sıralama
output_df = output_df.sort_values(by=["product", "brand_id", "store_id", "date"])

# Çıktıyı CSV olarak yazma
output_df.to_csv("features.csv", index=False)


usage: ipykernel_launcher.py [-h] [--min-date MIN_DATE] [--max-date MAX_DATE]
ipykernel_launcher.py: error: unrecognized arguments: -f C:\Users\oykua\AppData\Roaming\jupyter\runtime\kernel-e7898710-cbe0-4470-b722-dd35d088214e.json


SystemExit: 2