In [1]:
import pandas as pd

# Đọc file dataset
df = pd.read_csv('covereal.csv')

# Danh sách nguyên liệu tiếng Anh phù hợp cho người tiểu đường
healthy_ingredients = [
    # Rau củ không tinh bột
    'acorn squash', 'asparagus', 'aubergine', 'avocado', 'beetroot', 'broccoli', 'cabbage', 
    'carrot', 'cauliflower', 'celeriac', 'celery', 'chard', 'chicory', 'courgette', 'cucumber', 
    'green beans', 'kale', 'leek', 'lettuce', 'mushroom', 'okra', 'onion', 'radish', 'spinach', 
    'sprouting broccoli', 'sprouts',
    # Trái cây GI thấp
    'apple', 'blackberries', 'blueberries', 'raspberries', 'cherries', 'grapefruit', 'peach', 'pear',
    # Protein nạc
    'chicken', 'salmon', 'mackerel', 'sardines', 'tuna', 'prawn', 'tofu', 'turkey', 'egg',
    # Hạt và hạt giống
    'almonds', 'cashew nuts', 'chia', 'flaxseed', 'pecans', 'pistachios', 'pumpkin seeds', 
    'sesame seeds', 'walnuts',
    # Đậu và ngũ cốc nguyên cám
    'borlotti beans', 'broad beans', 'chickpeas', 'lentil', 'quinoa', 'pearl barley',
    # Gia vị và thảo dược
    'basil', 'chives', 'coriander', 'dill', 'parsley', 'rosemary', 'sage', 'thyme', 'cinnamon', 
    'cumin', 'fennel seeds', 'fenugreek', 'garlic', 'ginger', 'turmeric', 'mustard seeds', 
    'black peppercorns',
    # Chất béo lành mạnh
    'olive oil', 'rapeseed oil', 'sesame oil',
    # Sữa không đường
    'natural yogurt', 'cottage cheese', 'feta cheese', 'paneer cheese',
    # Nguyên liệu ban đầu từ code của bạn
    'peas', 'mint', 'couscous'
]

# Hàm phân loại món ăn theo tiêu chí cho người tiểu đường
def classify_diabetic(row):
    # Xử lý giá trị thiếu trong các cột dinh dưỡng
    if pd.isna(row['Carbs']) or pd.isna(row['Protein']) or pd.isna(row['Sugars']) or pd.isna(row['Fat']) or pd.isna(row['Fibre']):
        return 0  # Nếu thiếu dữ liệu dinh dưỡng, đánh dấu là không phù hợp
    
    # Điều kiện giảm carbs tinh chế, ưu tiên carbs phức tạp
    is_low_carbs = row['Carbs'] < 50  # Giới hạn carbs ở mức 50g
    
    # Giàu chất xơ và protein
    is_high_fiber_protein = row['Protein'] > 10 and row['Fibre'] > 5  # Yêu cầu chất xơ > 5g
    
    # Hạn chế đường và chất béo
    is_low_sugars_salt = row['Sugars'] < 10 and row['Fat'] < 15  # Giới hạn đường và chất béo
    
    # Nguyên liệu: Kiểm tra các thành phần có trong danh sách nguyên liệu phù hợp
    ingredients = row['Ingredients'].lower() if pd.notna(row['Ingredients']) else ''
    contains_healthy_ingredients = any(ingredient in ingredients for ingredient in healthy_ingredients)

    # Nếu đáp ứng đủ các điều kiện trên, đánh dấu là 1, nếu không thì 0
    if is_low_carbs and is_high_fiber_protein and is_low_sugars_salt and contains_healthy_ingredients:
        return 1
    else:
        return 0

# Áp dụng hàm phân loại cho mỗi món ăn trong dataset
df['Diabetic'] = df.apply(classify_diabetic, axis=1)

# Chỉ giữ lại các cột cần thiết
df_filtered = df[['Dish Name', 'Calories', 'Fat', 'Saturates', 'Sugars', 'Salt', 'Protein', 'Carbs', 'Fibre', 'Diabetic']]

# Lưu tất cả món ăn vào file CSV mới
output_filtered_file_path = 'diabeticreal_all.csv'
df_filtered.to_csv(output_filtered_file_path, index=False)

# Lưu riêng các món ăn phù hợp cho người tiểu đường (Diabetic == 1)
df_diabetic_only = df_filtered[df_filtered['Diabetic'] == 1]
output_diabetic_file_path = 'diabeticreal_suitable.csv'
df_diabetic_only.to_csv(output_diabetic_file_path, index=False)

# In thông tin kết quả
print(f"File chứa tất cả món ăn (phù hợp và không phù hợp) đã được lưu tại: {output_filtered_file_path}")
print(f"File chứa các món ăn phù hợp cho người tiểu đường đã được lưu tại: {output_diabetic_file_path}")
print(f"Tổng số món ăn: {len(df_filtered)}")
print(f"Số món ăn phù hợp cho người tiểu đường: {len(df_diabetic_only)}")


File chứa tất cả món ăn (phù hợp và không phù hợp) đã được lưu tại: diabeticreal_all.csv
File chứa các món ăn phù hợp cho người tiểu đường đã được lưu tại: diabeticreal_suitable.csv
Tổng số món ăn: 3133
Số món ăn phù hợp cho người tiểu đường: 44


In [2]:
import pandas as pd

# Đọc file dataset
df = pd.read_csv('covereal.csv')

# Danh sách nguyên liệu tiếng Anh phù hợp cho chế độ Clean Eating
clean_ingredients = [
    # Rau củ
    'acorn squash', 'asparagus', 'aubergine', 'avocado', 'beetroot', 'broccoli', 'cabbage', 
    'carrot', 'cauliflower', 'celeriac', 'celery', 'chard', 'chicory', 'courgette', 'cucumber', 
    'green beans', 'kale', 'leek', 'lettuce', 'mushroom', 'okra', 'onion', 'radish', 'spinach', 
    'sprouting broccoli', 'sprouts', 'sweet potato', 'butternut squash', 'kabocha', 'mooli',
    # Trái cây
    'apple', 'apricot', 'banana', 'blackberries', 'blueberries', 'cherries', 'clementine', 
    'cranberries', 'gooseberries', 'grapefruit', 'grapes', 'kiwi', 'mango', 'nectarine', 
    'orange', 'peach', 'pear', 'pineapple', 'plum', 'pomegranate', 'raspberries', 'strawberries',
    # Protein nạc
    'chicken', 'turkey', 'egg', 'salmon', 'mackerel', 'sardines', 'tuna', 'bream', 'monkfish fillets', 
    'prawn', 'shrimp', 'crabmeat', 'clam', 'cockles', 'mussel', 'squid', 'tofu', 'duck', 'lamb', 
    'beef', 'pork', 'rabbit', 'quail', 'venison',
    # Hạt và hạt giống
    'almonds', 'cashew nuts', 'chia', 'flaxseed', 'pecans', 'pistachios', 'pumpkin seeds', 
    'sesame seeds', 'walnuts',
    # Đậu và ngũ cốc nguyên cám
    'borlotti beans', 'broad beans', 'chickpeas', 'lentil', 'quinoa', 'pearl barley',
    # Gia vị và thảo dược
    'basil', 'bay leaves', 'chives', 'coriander', 'dill', 'fennel seeds', 'fenugreek', 'garlic', 
    'ginger', 'mint', 'oregano', 'parsley', 'rosemary', 'sage', 'thyme', 'cinnamon', 'cumin', 
    'cardamom', 'turmeric', 'mustard seeds', 'black peppercorns', 'paprika', 'saffron', 'anise', 
    'asafoetida', 'clove', 'star anise', 'chilli',
    # Chất béo lành mạnh
    'olive oil', 'coconut oil', 'sesame oil', 'ghee',
    # Sữa không đường
    'natural yogurt', 'cottage cheese', 'feta cheese', 'paneer cheese', 'whole milk',
    # Khác
    'cocoa powder', 'coconut', 'coconut milk', 'honey'
]

# Hàm phân loại món ăn theo tiêu chí Clean Eating
def classify_clean_eating(row):
    # Xử lý giá trị thiếu trong các cột dinh dưỡng
    if pd.isna(row['Carbs']) or pd.isna(row['Protein']) or pd.isna(row['Sugars']) or pd.isna(row['Fat']) or pd.isna(row['Fibre']):
        return 0  # Nếu thiếu dữ liệu dinh dưỡng, đánh dấu là không phù hợp
    
    # Điều kiện: Ít đường và chất béo bão hòa
    is_low_sugars_saturates = row['Sugars'] < 5 and row['Saturates'] < 5  # Giới hạn đường và chất béo bão hòa
    
    # Giàu chất xơ và protein
    is_high_fiber_protein = row['Protein'] > 8 and row['Fibre'] > 3  # Yêu cầu protein và chất xơ
    
    # Nguyên liệu: Kiểm tra các thành phần có trong danh sách nguyên liệu phù hợp
    ingredients = row['Ingredients'].lower() if pd.notna(row['Ingredients']) else ''
    contains_clean_ingredients = any(ingredient in ingredients for ingredient in clean_ingredients)

    # Nếu đáp ứng đủ các điều kiện trên, đánh dấu là 1, nếu không thì 0
    if is_low_sugars_saturates and is_high_fiber_protein and contains_clean_ingredients:
        return 1
    else:
        return 0

# Áp dụng hàm phân loại cho mỗi món ăn trong dataset
df['CleanEating'] = df.apply(classify_clean_eating, axis=1)

# Chỉ giữ lại các cột cần thiết
df_filtered = df[['Dish Name', 'Calories', 'Fat', 'Saturates', 'Sugars', 'Salt', 'Protein', 'Carbs', 'Fibre', 'CleanEating']]

# Lưu tất cả món ăn vào file CSV mới
output_filtered_file_path = 'cleaneating_all.csv'
df_filtered.to_csv(output_filtered_file_path, index=False)

# Lưu riêng các món ăn phù hợp cho Clean Eating (CleanEating == 1)
df_clean_eating_only = df_filtered[df_filtered['CleanEating'] == 1]
output_clean_eating_file_path = 'cleaneating_suitable.csv'
df_clean_eating_only.to_csv(output_clean_eating_file_path, index=False)

# In thông tin kết quả
print(f"File chứa tất cả món ăn (phù hợp và không phù hợp) đã được lưu tại: {output_filtered_file_path}")
print(f"File chứa các món ăn phù hợp cho Clean Eating đã được lưu tại: {output_clean_eating_file_path}")
print(f"Tổng số món ăn: {len(df_filtered)}")
print(f"Số món ăn phù hợp cho Clean Eating: {len(df_clean_eating_only)}")

File chứa tất cả món ăn (phù hợp và không phù hợp) đã được lưu tại: cleaneating_all.csv
File chứa các món ăn phù hợp cho Clean Eating đã được lưu tại: cleaneating_suitable.csv
Tổng số món ăn: 3133
Số món ăn phù hợp cho Clean Eating: 69
