In [2]:
import re

def parse_product_file(file_path):
    products = []
    product = None
    
    with open(file_path, 'r', encoding='utf-8') as file:
        for line in file:
            line = line.strip()
            
            # Xác định dòng bắt đầu một sản phẩm mới
            match = re.match(r"^(\d+)\. Mã sản phẩm: (\w+)$", line)
            if match:
                if product:
                    products.append(product)  # Lưu sản phẩm trước đó
                
                product = {
                    "Mã sản phẩm": match.group(2),
                    "Tên sản phẩm": "",
                    "Chất liệu": "",
                    "Kiểu dáng": "",
                    "Giá": "",
                    "Màu sắc": ""
                }
                continue
            
            if product:
                if line.startswith("Tên sản phẩm:"):
                    product["Tên sản phẩm"] = line.split(": ", 1)[1]
                elif line.startswith("- Chất liệu:"):
                    product["Chất liệu"] = line.split(": ", 1)[1]
                elif line.startswith("- Kiểu dáng:"):
                    product["Kiểu dáng"] = line.split(": ", 1)[1]
                elif line.startswith("- Giá:"):
                    product["Giá"] = line.split(": ", 1)[1]
                elif line.startswith("- Màu sắc:"):
                    product["Màu sắc"] = line.split(": ", 1)[1]
    
    if product:
        products.append(product)  # Lưu sản phẩm cuối cùng
    
    return products


In [3]:
file_paths = ["data/products/ao_so_mi.txt",
              "data/products/ao_thun.txt",
              "data/products/quan_jeans.txt",
              "data/products/quan_kaki.txt",
              "data/products/vay_dam.txt"]

for fp in file_paths:
    print(f"{fp} has {len(parse_product_file(fp))} products")

data/products/ao_so_mi.txt has 100 products
data/products/ao_thun.txt has 100 products
data/products/quan_jeans.txt has 100 products
data/products/quan_kaki.txt has 100 products
data/products/vay_dam.txt has 100 products


In [4]:
file_paths = [["data/products/ao_so_mi.txt", "Áo sơ mi"],
              ["data/products/ao_thun.txt", "Áo thun"],
              ["data/products/quan_jeans.txt", "Quần jean"],
              ["data/products/quan_kaki.txt", "Quần kaki"],
              ["data/products/vay_dam.txt", "Váy đầm"]]

cat_prds={}
for fp, cat in file_paths:
    cat_prds[cat]=parse_product_file(fp)

print(cat_prds.keys())

dict_keys(['Áo sơ mi', 'Áo thun', 'Quần jean', 'Quần kaki', 'Váy đầm'])


In [4]:
print(cat_prds["Áo sơ mi"][:2])

[{'Mã sản phẩm': 'ASM001', 'Tên sản phẩm': 'Áo Sơ Mi Trắng Công Sở', 'Chất liệu': '100% cotton cao cấp', 'Kiểu dáng': 'Regular fit (form suông vừa vặn)', 'Giá': '399.000 VNĐ', 'Màu sắc': 'Trắng'}, {'Mã sản phẩm': 'ASM002', 'Tên sản phẩm': 'Áo Sơ Mi Oxford Cơ Bản', 'Chất liệu': 'Vải Oxford (100% cotton)', 'Kiểu dáng': 'Slim fit (ôm nhẹ)', 'Giá': '429.000 VNĐ', 'Màu sắc': 'Trắng, Xanh nhạt, Xám nhạt'}]


In [6]:
import random
import json
size_chart = {
    "Áo sơ mi": ["XS", "S", "M", "L", "XL", "XXL"],
    "Áo thun": ["XS", "S", "M", "L", "XL", "XXL", "XXXL"],
    "Quần jean": ["28", "29", "30", "31", "32", "33", "34", "36", "38", "40"],
    "Quần kaki": ["28", "29", "30", "31", "32", "33", "34", "36", "38", "40"],
    "Váy đầm": ["XS", "S", "M", "L", "XL"]
}

def generate_product_list(cat_prds, size_chart):
    product_list = []
    
    for category, products in cat_prds.items():
        sizes = size_chart.get(category, [])  # Get sizes for the category
        
        for product in products:
            product_dict = {
                "id": product["Mã sản phẩm"],
                "name": product["Tên sản phẩm"],
                "category": category,
                "price": int(product["Giá"].split(" ")[0].replace(".", "")),
                "description": f"{category} bằng {product['Chất liệu'].lower()} kiểu dáng {product['Kiểu dáng'].lower()}",
                "sizes": {}
            }
            
            # Generate stock quantities for each size and color
            colors = product["Màu sắc"].split(", ")
            for size in sizes:
                product_dict["sizes"][size] = {color: random.randint(10, 50) for color in colors}
            
            product_list.append(product_dict)
    
    return product_list

# Example usage
product_data = generate_product_list(cat_prds, size_chart)

# Write to a JSON file
output_data = {"products": product_data}
with open("data/inventory/gen_inventory.json", "w", encoding="utf-8") as json_file:
    json.dump(output_data, json_file, ensure_ascii=False, indent=4)

