In [1]:
import csv
import json

In [2]:
input_file = 'aircraft_seat.csv'   # File CSV gốc
output_file = 'aircraft_seat_normalized.csv'  # File xuất chuẩn hóa

def normalize_boolean(value):
    if value.lower() == 'true':
        return '1'
    elif value.lower() == 'false':
        return '0'
    return value

with open(input_file, 'r', encoding='utf-8') as fin, \
     open(output_file, 'w', encoding='utf-8', newline='') as fout:
    
    reader = csv.DictReader(fin)
    fieldnames = reader.fieldnames
    writer = csv.DictWriter(fout, fieldnames=fieldnames)
    writer.writeheader()
    
    for row in reader:
        # Chuẩn hóa boolean các cột IsBlocked, IsExitRow (nếu có)
        for col in ['IsBlocked', 'IsExitRow']:
            if col in row:
                row[col] = normalize_boolean(row[col])
        
        # Chuẩn hóa trường Characteristics
        if 'Characteristics' in row and row['Characteristics']:
            # Bỏ escape "" -> " rồi parse JSON lại
            try:
                # Thay các "" thành " để thành JSON chuẩn
                json_str = row['Characteristics'].replace('""', '"')
                # Tải lại JSON để kiểm tra đúng định dạng
                parsed = json.loads(json_str)
                # Ghi lại chuẩn JSON (chuỗi)
                row['Characteristics'] = json.dumps(parsed, ensure_ascii=False)
            except Exception as e:
                print(f"Warning: Lỗi xử lý JSON ở dòng {reader.line_num}: {e}")
                # Giữ nguyên nếu lỗi
        
        writer.writerow(row)

print(f"Đã chuẩn hóa xong file và ghi vào: {output_file}")


Đã chuẩn hóa xong file và ghi vào: aircraft_seat_normalized.csv
