In [None]:
import pandas as pd
from datetime import datetime, timedelta

num_rows = 400
start_date = datetime(2023, 1, 1)
date_range = [start_date + timedelta(days=i) for i in range(num_rows)]

# Tạo DataFrame DIM_DATE
df_dim_date = pd.DataFrame({
    'DateKey': [int(d.strftime('%Y%m%d')) for d in date_range],
    'Date': [d.strftime('%Y-%m-%d') for d in date_range],
    'Day': [d.day for d in date_range],
    'DayName': [d.strftime('%A') for d in date_range],
    'Weekday': [1 if d.weekday() < 5 else 0 for d in date_range],  
    'Month': [d.month for d in date_range],
    'MonthName': [d.strftime('%B') for d in date_range],
    'Quarter': [((d.month - 1) // 3 + 1) for d in date_range],
    'Year': [d.year for d in date_range],
    'WeekOfYear': [int(d.strftime('%U')) for d in date_range],
    'IsHoliday': [1 if d.weekday() == 6 else 0 for d in date_range],  # Sunday = Holiday
    'IsMonthEnd': [1 if (d + timedelta(days=1)).month != d.month else 0 for d in date_range],
    'IsMonthStart': [1 if d.day == 1 else 0 for d in date_range],
    'IsQuarterStart': [1 if d.strftime('%m-%d') in ['01-01', '04-01', '07-01', '10-01'] else 0 for d in date_range],
    'IsQuarterEnd': [1 if d.strftime('%m-%d') in ['03-31', '06-30', '09-30', '12-31'] else 0 for d in date_range],
    'IsYearEnd': [1 if d.month == 12 and d.day == 31 else 0 for d in date_range],
    'IsYearStart': [1 if d.month == 1 and d.day == 1 else 0 for d in date_range],
})

# Xuất ra file CSV
df_dim_date.to_csv("dim_date.csv", index=False, encoding='utf-8-sig')

print(f" Fake thành công bảng DIM_DATE với {num_rows} dòng và lưu vào 'dim_date.csv'")


✅ Fake thành công bảng DIM_DATE với 400 dòng và lưu vào 'dim_date.csv'


In [5]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta

fake = Faker('en_US') 

rows = []
for i in range(1, 401):
    gender = random.choice(['Male', 'Female'])
    dob = fake.date_of_birth(minimum_age=18, maximum_age=70)
    join_date = fake.date_between(start_date=dob + timedelta(days=6570), end_date='today')  # 18 years old to today
    is_loyal = random.choice([True, False])
    is_active = random.choice([True, False])
    rows.append({
        'CustomerKey': i,
        'CustomerID': f"CUST-{100000 + i}",
        'FullName': fake.name_male() if gender == 'Male' else fake.name_female(),
        'Gender': gender,
        'DateOfBirth': dob,
        'Age': datetime.now().year - dob.year,
        'PhoneNumber': fake.phone_number(),
        'Email': fake.email(),
        'Address': fake.street_address(),
        'City': fake.city(),
        'Province': fake.state(),
        'Country': fake.country(),
        'CustomerType': random.choice(['Retail', 'Wholesale', 'Online']),
        'IsLoyalCustomer': is_loyal,
        'JoinDate': join_date,
        'IsActive': is_active,
        'CreateDate': fake.date_between(start_date=join_date, end_date='today')
    })

# Create DataFrame and save to CSV
df_customer = pd.DataFrame(rows)
df_customer.to_csv('dim_customer.csv', index=False, encoding='utf-8-sig')

print("Created 400 fake DIM_CUSTOMER rows and saved to 'dim_customer.csv'")


Created 400 fake DIM_CUSTOMER rows and saved to 'dim_customer.csv'


In [10]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta

fake = Faker()
rows = []
customer_key = 1

for _ in range(400):
    customer_id = f"CUST-{100000 + customer_key}"
    full_name = fake.name()
    gender = random.choice(['Male', 'Female'])
    dob = fake.date_of_birth(minimum_age=18, maximum_age=70)
    phone = fake.phone_number()
    email = fake.email()
    address = fake.street_address()
    city = fake.city()
    province = fake.state()
    country = fake.country()
    customer_type = random.choice(['Retail', 'Wholesale', 'Online'])

    num_versions = random.randint(1, 3)
    start_date = datetime(2020, 1, 1)
    for version in range(1, num_versions + 1):
        min_join_date = dob + timedelta(days=6570)  # dob is already a date
        start_date_date = start_date.date()

        if min_join_date < start_date_date:
            join_date = fake.date_between(start_date=min_join_date, end_date=start_date_date)
        else:
            join_date = start_date_date

        is_loyal = random.choice([True, False])
        is_active = random.choice([True, False])
        effective_from = start_date
        if version < num_versions:
            effective_to = start_date + timedelta(days=random.randint(180, 500))
            is_current = False
        else:
            effective_to = datetime(9999, 12, 31)
            is_current = True

        rows.append({
            'CustomerKey': customer_key,
            'CustomerID': customer_id,
            'FullName': full_name,
            'Gender': gender,
            'DateOfBirth': dob,
            'PhoneNumber': phone,
            'Email': email,
            'Address': address,
            'City': city,
            'Province': province,
            'Country': country,
            'CustomerType': customer_type,
            'IsLoyalCustomer': is_loyal,
            'JoinDate': join_date,
            'IsActive': is_active,
            'Version': version,
            'EffectiveFrom': effective_from.date(),
            'EffectiveTo': effective_to.date(),
            'IsCurrent': is_current
        })

        if effective_to.year < 9999:
            start_date = effective_to + timedelta(days=1)

    customer_key += 1

# Save to CSV
df_dim_customer2 = pd.DataFrame(rows)
df_dim_customer2.to_csv('dim_customer_2.csv', index=False, encoding='utf-8-sig')

print("✅ Success! Fake DIM_CUSTOMER_2 with SCD2 complete and saved to 'dim_customer_2.csv'")


✅ Success! Fake DIM_CUSTOMER_2 with SCD2 complete and saved to 'dim_customer_2.csv'


In [16]:
import pandas as pd

# Danh sách hãng gốc (có viết hoa khác nhau)
raw_brands = ['ASUS', 'Acer', 'Apple', 'Asus', 'Dell', 'GIGABYTE', 'HP', 'LG', 'Lenovo', 'MSI', 'MacBook', 'Macbook', 'Samsung']

# Chuẩn hóa: viết hoa chữ cái đầu, giữ nguyên nếu cần
brand_set = sorted(set([b.capitalize() if b.lower() != 'hp' else 'HP' for b in raw_brands]))

# Thông tin bổ sung cho các brand phổ biến
brand_info = {
    'Acer':      {'Country': 'Taiwan', 'FoundedYear': 1976, 'Website': 'https://www.acer.com'},
    'Asus':      {'Country': 'Taiwan', 'FoundedYear': 1989, 'Website': 'https://www.asus.com'},
    'Apple':     {'Country': 'USA', 'FoundedYear': 1976, 'Website': 'https://www.apple.com'},
    'Dell':      {'Country': 'USA', 'FoundedYear': 1984, 'Website': 'https://www.dell.com'},
    'Gigabyte':  {'Country': 'Taiwan', 'FoundedYear': 1986, 'Website': 'https://www.gigabyte.com'},
    'HP':        {'Country': 'USA', 'FoundedYear': 1939, 'Website': 'https://www.hp.com'},
    'LG':        {'Country': 'South Korea', 'FoundedYear': 1958, 'Website': 'https://www.lg.com'},
    'Lenovo':    {'Country': 'China', 'FoundedYear': 1984, 'Website': 'https://www.lenovo.com'},
    'MSI':       {'Country': 'Taiwan', 'FoundedYear': 1986, 'Website': 'https://www.msi.com'},
    'Macbook':   {'Country': 'USA', 'FoundedYear': 2006, 'Website': 'https://www.apple.com/macbook'},
    'Samsung':   {'Country': 'South Korea', 'FoundedYear': 1938, 'Website': 'https://www.samsung.com'},
}

# Tạo danh sách bảng
rows = []
for i, brand in enumerate(brand_set, start=1):
    info = brand_info.get(brand, {'Country': 'Unknown', 'FoundedYear': 0, 'Website': ''})
    rows.append({
        'BrandKey': i,
        'BrandID': f"BR{str(i).zfill(3)}",
        'BrandName': brand,
        'Country': info['Country'],
        'FoundedYear': info['FoundedYear'],
        'Website': info['Website']
    })

df_dim_brand = pd.DataFrame(rows)
df_dim_brand.to_csv("dim_brand_final.csv", index=False, encoding='utf-8-sig')

print("✅ Fake DIM_BRAND hoàn tất và lưu vào 'dim_brand_final.csv'")


✅ Fake DIM_BRAND hoàn tất và lưu vào 'dim_brand_final.csv'


In [17]:
import pandas as pd

# Danh sách danh mục laptop phổ biến
categories = [
    {"CategoryName": "Gaming", "Description": "High-performance laptops for gaming and heavy graphics tasks."},
    {"CategoryName": "Ultrabook", "Description": "Lightweight, thin, and portable laptops for mobility."},
    {"CategoryName": "Business", "Description": "Reliable laptops with security features for office and enterprise use."},
    {"CategoryName": "Student", "Description": "Affordable laptops suitable for school and college students."},
    {"CategoryName": "Creator", "Description": "Laptops with powerful CPU & GPU for content creators, designers, editors."},
    {"CategoryName": "2-in-1", "Description": "Convertible laptops with touchscreen and tablet mode."},
    {"CategoryName": "Workstation", "Description": "High-end machines for engineering, AI, and professional applications."},
    {"CategoryName": "Everyday Use", "Description": "Laptops for basic tasks like browsing, email, and media."}
]

# Tạo DataFrame
df_category = pd.DataFrame(categories)
df_category.insert(0, "CategoryKey", range(1, len(df_category) + 1))
df_category.insert(1, "CategoryID", [f"CAT{str(i).zfill(3)}" for i in range(1, len(df_category) + 1)])

# Xuất CSV
df_category.to_csv("dim_category.csv", index=False, encoding='utf-8-sig')

print("✅ DIM_CATEGORY đã được tạo và lưu vào 'dim_category.csv'")


✅ DIM_CATEGORY đã được tạo và lưu vào 'dim_category.csv'


In [1]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta

fake = Faker("en_US")

store_rows = []
for i in range(1, 21):  # Tạo 20 cửa hàng
    store_rows.append({
        "StoreKey": i,
        "StoreID": f"ST{str(i).zfill(3)}",
        "StoreName": f"{random.choice(['LaptopCenter', 'TechStore', 'LaptopHub', 'GearUp'])} #{i}",
        "City": fake.city(),
        "Province": fake.state(),
        "Country": "Vietnam",
        "ManagerName": fake.name(),
        "OpenDate": fake.date_between(start_date='-10y', end_date='-1y')
    })

df_store = pd.DataFrame(store_rows)
df_store.to_csv("dim_store.csv", index=False, encoding='utf-8-sig')
print("✅ Đã tạo file 'dim_store.csv' với 20 cửa hàng")


✅ Đã tạo file 'dim_store.csv' với 20 cửa hàng


In [2]:
supplier_names = [
    "FPT Distribution", "Viettel Import", "Thakral Brothers", "Asiasoft Supply",
    "TechOne", "Synnex FPT", "ADG Distribution", "CPT Trading", "VNG Commerce", "HoangHa Tech"
]

supplier_rows = []
for i, name in enumerate(supplier_names, start=1):
    supplier_rows.append({
        "SupplierKey": i,
        "SupplierID": f"SUP{str(i).zfill(3)}",
        "SupplierName": name,
        "ContactName": fake.name(),
        "PhoneNumber": fake.phone_number(),
        "Email": fake.email(),
        "Country": "Vietnam"
    })

df_supplier = pd.DataFrame(supplier_rows)
df_supplier.to_csv("dim_supplier.csv", index=False, encoding='utf-8-sig')
print("✅ Đã tạo file 'dim_supplier.csv' với 10 nhà cung cấp")


✅ Đã tạo file 'dim_supplier.csv' với 10 nhà cung cấp


In [3]:
import pandas as pd
from datetime import datetime
import random

# Danh sách phương thức thanh toán phổ biến
methods = [
    {"PaymentMethodName": "Tiền mặt",         "Provider": "N/A",               "IsOnline": False},
    {"PaymentMethodName": "Chuyển khoản ngân hàng", "Provider": "Vietcombank",       "IsOnline": True},
    {"PaymentMethodName": "Thẻ tín dụng",     "Provider": "Visa/MasterCard",   "IsOnline": True},
    {"PaymentMethodName": "Thẻ ghi nợ",       "Provider": "NAPAS",             "IsOnline": True},
    {"PaymentMethodName": "Ví Momo",          "Provider": "Momo",              "IsOnline": True},
    {"PaymentMethodName": "Ví ZaloPay",       "Provider": "ZaloPay",           "IsOnline": True},
    {"PaymentMethodName": "Ví ShopeePay",     "Provider": "ShopeePay",         "IsOnline": True},
    {"PaymentMethodName": "Quét mã QR",       "Provider": "VNPay",             "IsOnline": True},
    {"PaymentMethodName": "Trả góp qua thẻ",  "Provider": "FE Credit",         "IsOnline": False},
]

rows = []
for i, method in enumerate(methods, start=1):
    rows.append({
        "PaymentMethodKey": i,
        "PaymentMethodID": f"PM{str(i).zfill(3)}",
        "PaymentMethodName": method["PaymentMethodName"],
        "Provider": method["Provider"],
        "IsOnline": method["IsOnline"],
        "IsActive": random.choice([True, True, True, False]),  # Phần lớn là Active
        "CreateDate": datetime.strptime("2020-01-01", "%Y-%m-%d").date()
    })

# Tạo DataFrame và lưu file CSV
df_payment = pd.DataFrame(rows)
df_payment.to_csv("dim_payment_method.csv", index=False, encoding='utf-8-sig')

print("✅ Đã tạo DIM_PAYMENT_METHOD và lưu vào 'dim_payment_method.csv'")


✅ Đã tạo DIM_PAYMENT_METHOD và lưu vào 'dim_payment_method.csv'


In [4]:
import pandas as pd
from faker import Faker
import random
from datetime import datetime, timedelta

fake = Faker("en_US")

positions = ["Sales Staff", "Cashier", "Store Manager", "Support Agent", "Technician", "Warehouse Staff"]
store_keys = list(range(1, 21))  # Giả sử có 20 store

rows = []
for i in range(1, 101):  # 100 nhân viên
    gender = random.choice(['Male', 'Female'])
    full_name = fake.name_male() if gender == 'Male' else fake.name_female()
    position = random.choice(positions)
    store_key = random.choice(store_keys)
    hire_date = fake.date_between(start_date="-7y", end_date="-30d")
    is_active = random.choice([True, True, False])  # đa số đang còn làm

    rows.append({
        "EmployeeKey": i,
        "EmployeeID": f"EMP{str(i).zfill(4)}",
        "FullName": full_name,
        "Gender": gender,
        "Position": position,
        "StoreKey": store_key,
        "HireDate": hire_date,
        "IsActive": is_active
    })

df_employee = pd.DataFrame(rows)
df_employee.to_csv("dim_employee.csv", index=False, encoding='utf-8-sig')

print("✅ Đã tạo file 'dim_employee.csv' với 100 nhân viên")


✅ Đã tạo file 'dim_employee.csv' với 100 nhân viên


In [5]:
import pandas as pd

# Đọc dữ liệu gốc
df = pd.read_csv("dim_product.csv")

# Thêm cột ProductKey tự động tăng
df.insert(0, 'ProductKey', range(1, len(df) + 1))

# Đảm bảo đúng thứ tự cột như CREATE TABLE
columns_order = [
    'ProductKey', 'Name', 'Model', 'BrandKey', 'CategoryKey',
    'CPU', 'Cores', 'Threads', 'CpuSpeedGHz', 'MaxSpeed',
    'GPU', 'RAM_Value', 'RAM_Unit', 'RAM_Max_Value', 'RAM_Max_Unit',
    'RAM_Speed', 'RAM_Type', 'Storage_Value', 'Storage_Unit',
    'Screen_Size', 'Screen_Resolution', 'Screen_RefreshRate',
    'Screen_RefreshRate_Unit', 'Screen_Tech', 'Screen_Description',
    'Color_Coverage', 'Sound_Tech', 'Keyboard_Backlight', 'Webcams',
    'Wireless', 'Ports', 'OS', 'Battery', 'Material', 'Features',
    'Description', 'ReleaseDate', 'IsActive', 'Price', 'CurrentPrice',
    'Discount', 'Link', 'Image'
]

df = df[columns_order]

# Lưu lại file CSV đã có ProductKey
df.to_csv("dim_product_final.csv", index=False)


In [6]:
import pandas as pd

# Đọc file có dấu đúng
df = pd.read_csv("dim_product_ready.csv", encoding="utf-8-sig")

df.to_csv("dim_product_ready_vietnamese.csv", index=False, encoding="utf-8-sig")


In [None]:
import pandas as pd
import random

# Đọc dữ liệu từ các bảng đã có sẵn
orders_df = pd.read_csv("fact_order.csv")          
products_df = pd.read_csv("dim_product.csv")       

# Lấy danh sách OrderID và ProductKey để chọn ngẫu nhiên
order_ids = orders_df["OrderID"].tolist()
product_keys = products_df["ProductKey"].tolist()

rows = []
for order_detail_id in range(1, 401):  # 400 dòng
    order_id = random.choice(order_ids)
    product_key = random.choice(product_keys)

    quantity = random.randint(1, 5)
    
    # Lấy đơn giá từ DIM_PRODUCT (giá hiện tại)
    unit_price = float(products_df[products_df["ProductKey"] == product_key]["CurrentPrice"].values[0])
    
    total_price = round(quantity * unit_price, 2)
    discount = round(random.uniform(0, total_price * 0.3), 2)
    final_price = round(total_price - discount, 2)

    rows.append({
        "OrderDetailID": order_detail_id,
        "OrderID": order_id,
        "ProductKey": product_key,
        "Quantity": quantity,
        "UnitPrice": unit_price,
        "TotalPrice": total_price,
        "Discount": discount,
        "FinalPrice": final_price
    })

# Tạo DataFrame
df_order_detail = pd.DataFrame(rows)

# Xuất ra file CSV
df_order_detail.to_csv("fact_order_detail.csv", index=False)


In [10]:
import pandas as pd
import random

# Đọc dữ liệu từ các bảng DIM
dim_date = pd.read_csv("dim_date.csv")
dim_customer = pd.read_csv("dim_customer.csv")
dim_product = pd.read_csv("dim_product.csv")
dim_employee = pd.read_csv("dim_employee.csv")
dim_store = pd.read_csv("dim_store.csv")

# Tạo list ID từ các bảng để chọn ngẫu nhiên
date_keys = dim_date["DateKey"].tolist()
customer_keys = dim_customer["CustomerKey"].tolist()
product_keys = dim_product["ProductKey"].tolist()
employee_keys = dim_employee["EmployeeKey"].tolist()
store_keys = dim_store["StoreKey"].tolist()

rows = []
for sales_id in range(1, 401):  # 400 dòng
    date_key = random.choice(date_keys)
    customer_key = random.choice(customer_keys)
    product_key = random.choice(product_keys)
    employee_key = random.choice(employee_keys)
    store_key = random.choice(store_keys)
    
    quantity = random.randint(1, 5)
    unit_price = float(dim_product[dim_product["ProductKey"] == product_key]["CurrentPrice"].values[0])
    total_amount = round(quantity * unit_price, 2)
    discount = round(random.uniform(0, total_amount * 0.2), 2)  # Giảm giá tối đa 20%
    final_amount = round(total_amount - discount, 2)
    
    rows.append({
        "SalesID": sales_id,
        "DateKey": date_key,
        "CustomerKey": customer_key,
        "ProductKey": product_key,
        "EmployeeKey": employee_key,
        "StoreKey": store_key,
        "Quantity": quantity,
        "UnitPrice": unit_price,
        "TotalAmount": total_amount,
        "Discount": discount,
        "FinalAmount": final_amount
    })

# Tạo DataFrame
df_sales = pd.DataFrame(rows)

# Xuất ra file CSV
df_sales.to_csv("fact_sales.csv", index=False)


In [11]:
import pandas as pd
import random
from faker import Faker

fake = Faker()

# Load dữ liệu từ DIM
dim_date = pd.read_csv("dim_date.csv")
dim_customer = pd.read_csv("dim_customer.csv")
dim_product = pd.read_csv("dim_product.csv")

# Lấy danh sách keys
date_keys = dim_date["DateKey"].tolist()
customer_keys = dim_customer["CustomerKey"].tolist()
product_keys = dim_product["ProductKey"].tolist()

# Danh sách hành vi và thiết bị giả lập
action_types = ["View", "Click", "AddToCart", "Purchase", "RemoveFromCart"]
device_types = ["Mobile", "Desktop", "Tablet"]
browsers = ["Chrome", "Firefox", "Edge", "Safari", "Opera"]
referrers = ["google.com", "facebook.com", "instagram.com", "tiktok.com", "direct", "email"]

rows = []
for traffic_id in range(1, 401):
    date_key = random.choice(date_keys)
    customer_key = random.choice(customer_keys)
    product_key = random.choice(product_keys)
    
    action_type = random.choice(action_types)
    device_type = random.choice(device_types)
    browser = random.choice(browsers)
    session_id = fake.uuid4()
    time_spent = random.randint(5, 300)  # thời gian 5 giây đến 5 phút
    referrer = random.choice(referrers)
    ip = fake.ipv4()
    
    rows.append({
        "TrafficID": traffic_id,
        "DateKey": date_key,
        "CustomerKey": customer_key,
        "ProductKey": product_key,
        "ActionType": action_type,
        "DeviceType": device_type,
        "Browser": browser,
        "SessionID": session_id,
        "TimeSpentSeconds": time_spent,
        "Referrer": referrer,
        "IP": ip
    })

# Tạo DataFrame
df_traffic = pd.DataFrame(rows)

# Xuất ra CSV
df_traffic.to_csv("fact_web_traffic.csv", index=False)


In [12]:
import pandas as pd
import random

# Load các DIM cần thiết
dim_date = pd.read_csv("dim_date.csv")
dim_product = pd.read_csv("dim_product.csv")
dim_store = pd.read_csv("dim_store.csv")

# Lấy các khóa chính
date_keys = dim_date["DateKey"].tolist()
product_keys = dim_product["ProductKey"].tolist()
store_keys = dim_store["StoreKey"].tolist()

# Tạo danh sách bản ghi giả
rows = []
for inventory_id in range(1, 401):
    date_key = random.choice(date_keys)
    product_key = random.choice(product_keys)
    store_key = random.choice(store_keys)
    
    quantity_in_stock = random.randint(0, 300)
    reorder_level = random.randint(20, 100)

    rows.append({
        "InventoryID": inventory_id,
        "DateKey": date_key,
        "ProductKey": product_key,
        "StoreKey": store_key,
        "QuantityInStock": quantity_in_stock,
        "ReorderLevel": reorder_level
    })

# Tạo DataFrame và lưu file
df_inventory = pd.DataFrame(rows)
df_inventory.to_csv("fact_inventory.csv", index=False)


In [13]:
import pandas as pd
import random
from faker import Faker

fake = Faker()

# Load dữ liệu cần thiết
dim_date = pd.read_csv("dim_date.csv")
dim_customer = pd.read_csv("dim_customer.csv")
dim_product = pd.read_csv("dim_product.csv")

# Lấy các khóa chính
date_keys = dim_date["DateKey"].tolist()
customer_keys = dim_customer["CustomerKey"].tolist()
product_keys = dim_product["ProductKey"].tolist()

# Lý do trả hàng mẫu
return_reasons = [
    "Sản phẩm bị lỗi",
    "Không đúng mô tả",
    "Không còn nhu cầu",
    "Sản phẩm bị hư hại khi vận chuyển",
    "Đặt nhầm sản phẩm",
    "Thời gian giao hàng quá lâu"
]

# Tạo dữ liệu giả
rows = []
for return_id in range(1, 401):
    date_key = random.choice(date_keys)
    customer_key = random.choice(customer_keys)
    product_key = random.choice(product_keys)
    quantity = random.randint(1, 3)
    reason = random.choice(return_reasons)
    
    # Giả sử hoàn tiền là một phần của giá gốc sản phẩm
    refund_unit_price = random.uniform(500000, 20000000)
    refund_amount = round(refund_unit_price * quantity * random.uniform(0.8, 1.0), 2)

    rows.append({
        "ReturnID": return_id,
        "DateKey": date_key,
        "CustomerKey": customer_key,
        "ProductKey": product_key,
        "Quantity": quantity,
        "Reason": reason,
        "RefundAmount": refund_amount
    })

# Tạo DataFrame và lưu ra CSV
df_return = pd.DataFrame(rows)
df_return.to_csv("fact_return.csv", index=False)
