In [19]:
import pandas as pd
import ast

# Load CSV
df = pd.read_csv('product_laptop.csv')

# Tên các tab trong 'Cấu hình'
tab_names = ['cpu', 'gpu', 'ram_dist', 'man_hinh', 'ket_noi', 'kichthuoc_khoiluong_pin']

# 1. Split theo ';' để tách các tab
df_tabs = df['Cấu hình'].str.split(';', expand=True)

# 2. Hàm làm sạch chuỗi: lấy đúng phần list of tuples
def clean_tab_string(s):
    if pd.isna(s):
        return '[]'  # list rỗng
    start = s.find('[')
    end = s.rfind(']')
    if start != -1 and end != -1:
        return s[start:end+1]
    else:
        return '[]'

# 3. Chuyển từng tab thành dict
for i, tab in enumerate(tab_names):
    df_tabs[i] = df_tabs[i].apply(clean_tab_string)       # làm sạch chuỗi
    df_tabs[tab] = df_tabs[i].apply(lambda x: dict(ast.literal_eval(x)))  # string -> dict
# 4. Bung dict từng tab thành cột riêng
df_expanded = df.copy()
for tab in tab_names:
    tab_df = df_tabs[tab].apply(pd.Series)
    df_expanded = pd.concat([df_expanded, tab_df], axis=1)

# 5. Xóa cột gốc nếu muốn
df_expanded = df_expanded.drop(columns=['Cấu hình'])

df_expanded['Tên'] = df_expanded['Tên'].apply(lambda x: x[len('Laptop '):])
df_expanded['Hãng'] = df_expanded['Tên'].apply(lambda x: x[:x.find(' ')])

# 6. Xem kết quả
thumb = pd.read_csv('thumb_laptop.csv')
thumb['Name'] = thumb['Name'].apply(lambda x: x[len('Laptop '):])
df_expanded.head()

df_expanded = pd.merge(thumb,df_expanded,left_on='Name',right_on='Tên',how = 'inner')
df_expanded.drop(columns = 'Tên', inplace = True)
df_expanded['phanloai'] = 'laptop'
df_expanded.columns = [
    "name",                # Name
    "thumb",               # thumb           
    "price",               # Giá
    "images",              # Ảnh
    "main_image",          # Ảnh tổng thế
    "cpu_tech",            # Công nghệ CPU
    "cpu_cores",           # Số nhân
    "cpu_threads",         # Số luồng
    "cpu_speed",           # Tốc độ CPU
    "npu",                 # NPU
    "ai_tops",             # Hiệu năng xử lý AI (TOPS)
    "gpu",                 # Card màn hình
    "gpu_cores",           # Số nhân GPU
    "gpu_tgp",             # Công suất đồ hoạ - TGP
    "ram",                 # RAM
    "ram_type",            # Loại RAM
    "ram_bus",             # Tốc độ Bus RAM
    "ram_max",             # Hỗ trợ RAM tối đa
    "storage",             # Ổ cứng
    "screen_size",         # Kích thước màn hình
    "screen_resolution",   # Độ phân giải
    "panel_type",          # Tấm nền
    "refresh_rate",        # Tần số quét
    "screen_tech",         # Công nghệ màn hình
    "color_gamut",         # Độ phủ màu
    "touch_screen",        # Màn hình cảm ứng
    "ports",               # Cổng giao tiếp
    "wireless",            # Kết nối không dây
    "webcam",              # Webcam
    "keyboard_backlight",  # Đèn bàn phím
    "security",            # Bảo mật
    "audio_tech",          # Công nghệ âm thanh
    "cooling",             # Tản nhiệt
    "other_features",      # Tính năng khác
    "card_reader",         # Khe đọc thẻ nhớ
    "battery",             # Thông tin Pin
    "os",                  # Hệ điều hành
    "release_date",        # Thời điểm ra mắt
    "dimensions",          # Kích thước
    "material",            # Chất liệu
    "brand",               # Hãng
    "phanloai"             # phanloai
]

import re
df_expanded['price'] = df_expanded['price'].apply(
    lambda x: float(re.sub(r'[^\d]', '', str(x)))
)
# 7. (Tuỳ chọn) xuất CSV
df_expanded.to_csv('product_expanded_lap.csv',index = False)
print(df_expanded.columns)

Index(['name', 'thumb', 'price', 'images', 'main_image', 'cpu_tech',
       'cpu_cores', 'cpu_threads', 'cpu_speed', 'npu', 'ai_tops', 'gpu',
       'gpu_cores', 'gpu_tgp', 'ram', 'ram_type', 'ram_bus', 'ram_max',
       'storage', 'screen_size', 'screen_resolution', 'panel_type',
       'refresh_rate', 'screen_tech', 'color_gamut', 'touch_screen', 'ports',
       'wireless', 'webcam', 'keyboard_backlight', 'security', 'audio_tech',
       'cooling', 'other_features', 'card_reader', 'battery', 'os',
       'release_date', 'dimensions', 'material', 'brand', 'phanloai'],
      dtype='object')


In [25]:
from sqlalchemy import create_engine
engine = create_engine("mysql+pymysql://root:trang2701@localhost/web_shop")
#df_expanded[['name','price','thumb','main_image','phanloai','release_date','brand']].to_sql('products', con = engine,if_exists='append', index=False)

In [None]:
import numpy as np
from sqlalchemy import create_engine
engine = create_engine("mysql+pymysql://root:trang2701@localhost/web_shop")
df_img = df_expanded[['name', 'images']]

# Tách ảnh thành nhiều cột
df_img1 = df_img['images'].str.split(';', expand=True)

# Gắn lại cột name
df_img1['product_id'] = np.arange(55,124,1)

# Đưa các cột ảnh về dạng dài
df_long = df_img1.melt(id_vars='product_id', value_name='image', var_name='order')

# Bỏ các giá trị NaN
df_long = df_long.dropna(subset=['image']).drop(columns=['order'])
df_long.rename(columns = {
    'image' : 'img'
}, inplace = True)

#df_long.to_sql('product_images', con = engine, if_exists='append', index = False)



350

In [None]:
import numpy as np
from sqlalchemy import create_engine
engine = create_engine("mysql+pymysql://root:trang2701@localhost/web_shop")
df_epec = df_expanded.drop(columns = [
    'name',
    'price',
    'thumb',
    'main_image',
    'phanloai',
    'release_date',
    'brand',
    'images'
])
df_epec['product_id'] = np.arange(55,124,1)
column_spec = df_epec.columns.to_list()
mapping = {
    # CPU & GPU
    'cpu_tech': 'CPU & GPU',
    'cpu_cores': 'CPU & GPU',
    'cpu_threads': 'CPU & GPU',
    'cpu_speed': 'CPU & GPU',
    'npu': 'CPU & GPU',
    'ai_tops': 'CPU & GPU',
    'gpu': 'CPU & GPU',
    'gpu_cores': 'CPU & GPU',
    'gpu_tgp': 'CPU & GPU',

    # Bộ nhớ
    'ram': 'Bộ nhớ',
    'ram_type': 'Bộ nhớ',
    'ram_bus': 'Bộ nhớ',
    'ram_max': 'Bộ nhớ',
    'storage': 'Bộ nhớ',

    # Màn hình
    'screen_size': 'Màn hình',
    'screen_resolution': 'Màn hình',
    'panel_type': 'Màn hình',
    'refresh_rate': 'Màn hình',
    'screen_tech': 'Màn hình',
    'color_gamut': 'Màn hình',
    'touch_screen': 'Màn hình',

    # Kết nối
    'ports': 'Kết nối',
    'wireless': 'Kết nối',

    # Camera & Âm thanh
    'webcam': 'Camera & Âm thanh',
    'audio_tech': 'Camera & Âm thanh',

    # Bảo mật & Tiện ích
    'keyboard_backlight': 'Tiện ích',
    'security': 'Tiện ích',
    'cooling': 'Tiện ích',
    'other_features': 'Tiện ích',
    'card_reader': 'Tiện ích',

    # Pin
    'battery': 'Pin',

    # Hệ điều hành
    'os': 'Phần mềm',

    # Thiết kế & Kích thước
    'release_date': 'Thiết kế & Kích thước',
    'dimensions': 'Thiết kế & Kích thước',
    'material': 'Thiết kế & Kích thước',
    'brand': 'Thiết kế & Kích thước'
}


spec_map = {
    'cpu_tech': 'Công nghệ CPU',
    'cpu_cores': 'Số nhân CPU',
    'cpu_threads': 'Số luồng CPU',
    'cpu_speed': 'Tốc độ CPU',
    'npu': 'NPU',
    'ai_tops': 'Hiệu năng AI (TOPS)',
    'gpu': 'Card đồ họa (GPU)',
    'gpu_cores': 'Số nhân GPU',
    'gpu_tgp': 'Công suất đồ họa (TGP)',

    'ram': 'Dung lượng RAM',
    'ram_type': 'Loại RAM',
    'ram_bus': 'Tốc độ Bus RAM',
    'ram_max': 'Hỗ trợ RAM tối đa',
    'storage': 'Ổ cứng',

    'screen_size': 'Kích thước màn hình',
    'screen_resolution': 'Độ phân giải màn hình',
    'panel_type': 'Tấm nền',
    'refresh_rate': 'Tần số quét',
    'screen_tech': 'Công nghệ màn hình',
    'color_gamut': 'Độ phủ màu',
    'touch_screen': 'Màn hình cảm ứng',

    'ports': 'Cổng kết nối',
    'wireless': 'Kết nối không dây',

    'webcam': 'Webcam',
    'audio_tech': 'Công nghệ âm thanh',

    'keyboard_backlight': 'Đèn bàn phím',
    'security': 'Bảo mật',
    'cooling': 'Tản nhiệt',
    'other_features': 'Tính năng khác',
    'card_reader': 'Khe đọc thẻ nhớ',

    'battery': 'Thông tin pin',

    'os': 'Hệ điều hành',

    'release_date': 'Thời điểm ra mắt',
    'dimensions': 'Kích thước',
    'material': 'Chất liệu',
    'brand': 'Hãng'
}



df_long = df_epec.melt(
    id_vars='product_id',
    value_vars=column_spec,
    var_name='spec',
    value_name='info'
)

df_long['loai_cau_hinh'] = df_long['spec'].map(mapping)
df_long['spec'] = df_long['spec'].map(spec_map)
df_long = df_long.dropna()
#df_long.to_sql('specifications', con = engine, if_exists='append', index = False)


1833

In [38]:
column_spec

['name',
 'os',
 'cpu',
 'cpu_speed',
 'gpu',
 'ram',
 'storage',
 'available_storage',
 'contacts',
 'memory_card',
 'rear_camera_resolution',
 'rear_camera_video',
 'rear_camera_flash',
 'rear_camera_features',
 'front_camera_resolution',
 'front_camera_features',
 'screen_tech',
 'screen_resolution',
 'screen_size',
 'max_brightness',
 'screen_protection',
 'battery_capacity',
 'battery_type',
 'max_charging',
 'battery_tech',
 'charger_included',
 'security_features',
 'special_features',
 'waterproof',
 'recording',
 'video_formats',
 'audio_formats',
 'radio',
 'mobile_network',
 'sim',
 'wifi',
 'gps',
 'bluetooth',
 'ports',
 'headphone_jack',
 'other_connections',
 'design',
 'material',
 'dimensions_weight']

In [42]:
df_expanded

Unnamed: 0,name,thumb,price,images,main_image,os,cpu,cpu_speed,gpu,ram,...,bluetooth,ports,headphone_jack,other_connections,design,material,dimensions_weight,release_date,brand,phanloai
0,Samsung Galaxy S25 Ultra 5G 12GB/256GB,https://cdn.tgdd.vn/Products/Images/42/333347/...,26880000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 15,Qualcomm Snapdragon 8 Elite For Galaxy 8 nhân,4.47 GHz,Adreno 830,12 GB,...,v5.4,Type-C,Type-C,NFC,Nguyên khối,Khung Titan & Mặt lưng kính cường lực,Dài 162.8 mm - Ngang 77.6 mm - Dày 8.2 mm - Nặ...,01/2025,Samsung,phone
1,Samsung Galaxy Z Fold7 5G 12GB/256GB,https://cdn.tgdd.vn/Products/Images/42/338738/...,43990000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 16,Qualcomm Snapdragon 8 Elite For Galaxy 8 nhân,4.47 GHz,Adreno 830,12 GB,...,v5.4,Type-C,Type-C,OTG | NFC,Nguyên khối,Khung nhôm & Mặt lưng kính cường lực,Dài 158.4 mm - Ngang 143.2 mm (khi mở) | 72.8 ...,07/2025,Samsung,phone
2,Samsung Galaxy A56 5G 12GB/256GB,https://cdn.tgdd.vn/Products/Images/42/334932/...,10980000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 15,Exynos 1580 8 nhân,2.9 GHz,AMD Ariel 2WGP-1RB 1.3 GHz,12 GB,...,v5.3,Type-C,Type-C,NFC,Nguyên khối,Khung kim loại & Mặt lưng kính,Dài 162.2 mm - Ngang 77.5 mm - Dày 7.4 mm - Nặ...,03/2025,Samsung,phone
3,Samsung Galaxy A26 5G 6GB/128GB,https://cdn.tgdd.vn/Products/Images/42/335915/...,6070000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 15,Exynos 1380 8 nhân,4 nhân 2.4 GHz & 4 nhân 2 GHz,Mali-G68,6 GB,...,v5.3,Type-C,Type-C,NFC,Nguyên khối,Khung nhựa & Mặt lưng kính,Dài 164 mm - Ngang 77.5 mm - Dày 7.7 mm - Nặng...,04/2025,Samsung,phone
4,Samsung Galaxy A06 5G 6GB/128GB,https://cdn.tgdd.vn/Products/Images/42/335234/...,4210000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 15,MediaTek Dimensity 6300 5G 8 nhân,2 nhân 2.4 GHz & 6 nhân 2 GHz,Mali-G57,6 GB,...,v5.3,Type-C,3.5 mm,,Nguyên khối,Khung & Mặt lưng nhựa,Dài 167.3 mm - Ngang 77.3 mm - Dày 8 mm - Nặng...,03/2025,Samsung,phone
5,Samsung Galaxy A36 5G 12GB/256GB,https://cdn.tgdd.vn/Products/Images/42/334930/...,9310000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 15,Snapdragon 6 Gen 3 8 nhân,2.4 GHz,Adreno 710,12 GB,...,v5.4,Type-C,Type-C,NFC,Nguyên khối,Khung nhựa & Mặt lưng kính,Dài 162.9 mm - Ngang 78.2 mm - Dày 7.4 mm - Nặ...,03/2025,Samsung,phone
6,Samsung Galaxy S24 5G 8GB/256GB,https://cdn.tgdd.vn/Products/Images/42/319665/...,17510000.0,https://cdn.tgdd.vn/Products/Images/42/319665/...,https://cdn.tgdd.vn/Products/Images/42/319665/...,Android 14,Exynos 2400 10 nhân,3.2 GHz,Xclipse 940,8 GB,...,v5.3,Type-C,,NFC,Nguyên khối,Khung nhôm & Mặt lưng kính cường lực,Dài 147 mm - Ngang 70.6 mm - Dày 7.6 mm - Nặng...,01/2024,Samsung,phone
7,Samsung Galaxy Z Flip7 5G 12GB/256GB,https://cdn.tgdd.vn/Products/Images/42/338736/...,26990000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 16,Exynos 2500 10 nhân,3.3 GHz,Xclipse 950,12 GB,...,v5.4,Type-C,Type-C,OTG | NFC,Nguyên khối,Khung nhôm & Mặt lưng kính cường lực,Dài 166.7 (khi mở) | 85.5 mm (khi gập) - Ngang...,07/2025,Samsung,phone
8,Samsung Galaxy S24 FE 5G 8GB/256GB,https://cdn.tgdd.vn/Products/Images/42/329785/...,13560000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 14,Exynos 2400e 8 nhân,3.1 GHz,Xclipse 940,8 GB,...,v5.3,Type-C,Type-C,NFC,Nguyên khối,Khung kim loại & Mặt lưng kính,Dài 162 mm - Ngang 77.3 mm - Dày 8 mm - Nặng 2...,09/2024,Samsung,phone
9,Samsung Galaxy S25 5G 12GB/256GB,https://cdn.tgdd.vn/Products/Images/42/333363/...,22580000.0,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,https://cdnv2.tgdd.vn/mwg-static/tgdd/Products...,Android 15,Qualcomm Snapdragon 8 Elite For Galaxy 8 nhân,4.47 GHz,Adreno 830,12 GB,...,v5.4,Type-C,Type-C,NFC,Nguyên khối,Khung nhôm & Mặt lưng kính cường lực,Dài 146.9 mm - Ngang 70.5 mm - Dày 7.2 mm - Nặ...,01/2025,Samsung,phone
