In [7]:
import numpy as np
import pandas as pd

# Số lượng mẫu dữ liệu bạn muốn tạo
sample_size = 5000

# Tạo dữ liệu mẫu về phần trăm mỡ cơ thể từ 3% đến 50%
body_fat_data = np.random.uniform(3.0, 50.0, sample_size)

# Tạo dữ liệu mẫu về BMI từ 3 đến 50
bmi_data = np.random.uniform(3, 50, sample_size)

# Tạo dữ liệu mẫu về cân nặng từ 30 đến 100
weight_data = np.random.uniform(30, 100, sample_size)

# Tạo dữ liệu mẫu về chiều cao từ 100 đến 200
height_data = np.random.uniform(100, 200, sample_size)

# Tạo cột độ khó với giá trị từ 1 đến 3 ngẫu nhiên
difficulty_levels = np.random.choice([1, 2, 3], sample_size)

# Tạo cột loại bài tập (1: Cardio, 2: Strength Training, 3: Cả hai) dựa trên điều kiện BMI và phần trăm mỡ cơ thể
exercise_types = []

for i in range(sample_size):
    bdf = body_fat_data[i]
    bmi = bmi_data[i]
    difficulty = difficulty_levels[i]
    
    if 3 <= bdf <= 5:
        exercise_type = 2  # Strength Training
    elif 5 < bdf <= 10:
        exercise_type = 2  # Strength Training
    elif 11 <= bdf <= 13:
        if bmi < 25:
            exercise_type = 2  # Strength Training
        else:
            exercise_type = 3  # Both (Strength Training and Cardio)
    elif 14 <= bdf <= 17:
        if bmi < 25:
            exercise_type = 2  # Strength Training
        else:
            exercise_type = 3  # Both (Strength Training and Cardio)
    elif 18 <= bdf <= 25:
        if bmi < 25:
            exercise_type = 2  # Strength Training
        else:
            exercise_type = 3  # Both (Strength Training and Cardio)
    else:
        exercise_type = 1  # Cardio
    
    exercise_types.append(exercise_type)

# Tạo dataframe chứa dữ liệu
data = pd.DataFrame({
    'BodyFatPercentage': body_fat_data,
    'BMI': bmi_data,
    'DifficultyLevel': difficulty_levels,
    'ExerciseType': exercise_types,
    'Weight': weight_data,
    'Height': height_data
})

## Hàm tính BMR dựa trên dữ liệu đầu vào
def calculate_bmr(bdf, bmi, weight, height):
    # Thay thế bằng cách tính BMR của bạn
    # Ví dụ đơn giản: BMR = a * weight + b * height + c * age
    a = 10
    b = 6.25
    c = 5
    age = 30  # Độ tuổi giả định
    bmr = a * weight + b * height - c * age
    return bmr

# Hàm tính Physical Activity dựa trên dữ liệu đầu vào
def calculate_physical_activity(bdf, bmi, weight, height):
    # Thay thế bằng cách tính Physical Activity của bạn
    # Ví dụ đơn giản: Physical Activity = weight * height / (bmi * age)
    age = 30  # Độ tuổi giả định
    physical_activity = weight * height / (bmi * age)
    return physical_activity

# Thêm cột TDEE vào dataframe
tdee_values = []
for i in range(sample_size):
    bdf = data['BodyFatPercentage'][i]
    bmi = data['BMI'][i]
    weight = data['Weight'][i]
    height = data['Height'][i]
    
    bmr = calculate_bmr(bdf, bmi, weight, height)
    physical_activity = calculate_physical_activity(bdf, bmi, weight, height)
    tdee = bmr + physical_activity
    tdee_values.append(tdee)

data['TDEE'] = tdee_values


In [8]:
data

Unnamed: 0,BodyFatPercentage,BMI,DifficultyLevel,ExerciseType,Weight,Height,TDEE
0,34.175859,43.004913,1,1,99.525640,188.490363,2037.861846
1,23.867976,6.857392,2,2,57.671151,153.756741,1430.794645
2,45.521355,31.618442,3,1,86.505216,172.921975,1811.584473
3,15.759591,40.841293,1,3,95.412002,100.791129,1441.913398
4,21.549028,48.150677,1,3,32.980361,126.497713,973.302434
...,...,...,...,...,...,...,...
4995,6.235790,11.982209,2,2,32.017780,147.290562,1103.863029
4996,22.050854,43.910584,1,3,49.729389,114.558121,1067.606768
4997,16.342209,17.543850,2,2,46.079741,141.988434,1210.656433
4998,32.630619,41.057386,3,1,31.270325,184.401221,1319.892368


In [9]:

# Đặt tên cho tệp CSV
csv_file_name = 'exercise.csv'

# Lưu DataFrame vào tệp CSV
data.to_csv(csv_file_name, index=False)

print("Dữ liệu đã được lưu vào tệp CSV:", csv_file_name)


Dữ liệu đã được lưu vào tệp CSV: exercise.csv


In [28]:
# Tạo và huấn luyện mô hình Random Forest
X = data[['BodyFatPercentage', 'BMI']]
y_difficulty = data['DifficultyLevel']
y_exercise = data['ExerciseType']
model_difficulty = RandomForestClassifier(n_estimators=100, random_state=42)
model_difficulty.fit(X, y_difficulty)

model_exercise = RandomForestClassifier(n_estimators=100, random_state=42)
model_exercise.fit(X, y_exercise)
# Lấy dự đoán từ mô hình độ khó
predicted_difficulty_levels = model_difficulty.predict(X)

# Lấy dự đoán từ mô hình loại bài tập
predicted_exercise_types = model_exercise.predict(X)

# Tạo một điều kiện để kết hợp dự đoán từ cả hai mô hình
combined_predictions = []
for i in range(len(X)):
    if predicted_difficulty_levels[i] == desired_difficulty and predicted_exercise_types[i] == desired_exercise:
        combined_predictions.append('Satisfied')  # Hoặc thay bằng giá trị bạn muốn

# Dướng dẫn cách sử dụng combined_predictions cho mục đích của bạn
print("Combined Predictions:", combined_predictions)


NameError: name 'desired_difficulty' is not defined

Unnamed: 0,BodyFatPercentage,DifficultyLevel,ExerciseType,ExerciseLabel
0,45.823804,2,Strength Training,Moderate Strength Training
1,9.005431,1,Strength Training,Easy Strength Training
2,13.914661,2,Strength Training,Moderate Strength Training
3,32.875740,1,Strength Training,Easy Strength Training
4,27.382411,1,Strength Training,Easy Strength Training
...,...,...,...,...
95,47.588140,1,Cardio,Easy Cardio
96,3.617546,3,Cardio,Difficult Cardio
97,7.105745,2,Strength Training,Moderate Strength Training
98,44.828863,3,Cardio,Difficult Cardio


In [6]:
from sklearn.ensemble import RandomForestClassifier
X = data[['BodyFatPercentage', 'DifficultyLevel']]
y = data['ExerciseLabel']

model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X, y)

In [7]:
new_data = pd.DataFrame({
    'BodyFatPercentage': [15.0],  # Thay thế giá trị này bằng phần trăm mỡ cơ thể của người cụ thể
    'DifficultyLevel': [2]  # Thay thế giá trị này bằng độ khó của người cụ thể
})

# Sử dụng mô hình Random Forest để dự đoán loại bài tập cho người cụ thể
predicted_label = model.predict(new_data)

In [8]:
predicted_label

array(['Moderate Strength Training'], dtype=object)

In [11]:
new_data = pd.DataFrame({
    'BodyFatPercentage': [20.0],
    'DifficultyLevel': [2]
})
predicted_labels = model.predict(new_data)
print("Predicted Exercise Labels for Person:", predicted_labels)

Predicted Exercise Labels for Person: ['Moderate Cardio']
