In [1]:
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score

# Đọc dữ liệu từ file CSV
train_data = pd.read_csv('data.csv')  # Tập dữ liệu huấn luyện
test_data = pd.read_csv('testdata.csv')    # Tập dữ liệu kiểm tra

# Kiểm tra và chuyển đổi cột thành chuỗi nếu cần
train_data['Learning Style'] = train_data['Learning Style'].astype(str)
train_data['Interest'] = train_data['Interest'].astype(str)
train_data['Recommended Course'] = train_data['Recommended Course'].astype(str)

test_data['Learning Style'] = test_data['Learning Style'].astype(str)
test_data['Interest'] = test_data['Interest'].astype(str)
test_data['Recommended Course'] = test_data['Recommended Course'].astype(str)

# Bước 1: Kết hợp Learning Style và Interest trong tập huấn luyện
train_data['Combined'] = train_data['Learning Style'] + " " + train_data['Interest']

# Bước 2: Vectorization
vectorizer = CountVectorizer()
X_train_vectorized = vectorizer.fit_transform(train_data['Combined'])
y_train = train_data['Recommended Course']

# Bước 3: Kết hợp Learning Style và Interest trong tập kiểm tra
test_data['Combined'] = test_data['Learning Style'] + " " + test_data['Interest']
X_test_vectorized = vectorizer.transform(test_data['Combined'])
y_test = test_data['Recommended Course']

# Bước 4: Huấn luyện mô hình
model = MultinomialNB()
model.fit(X_train_vectorized, y_train)

# Bước 5: Dự đoán trên tập kiểm tra
y_pred = model.predict(X_test_vectorized)

# Bước 6: Tính toán độ chính xác
accuracy = accuracy_score(y_test, y_pred)

# In ra độ chính xác
print(f"Accuracy: {accuracy * 100:.2f}%")


# Hàm gợi ý khóa học
def recommend_course(learning_style, interest):
    input_data = vectorizer.transform([learning_style + " " + interest])
    predicted_course = model.predict(input_data)
    return predicted_course[0]

# Hàm lấy khóa học liên quan
def get_related_courses(interest, recommended_course):
    # Lọc các khóa học dựa trên interest
    related_courses = train_data[train_data['Interest'] == interest]
    # Loại bỏ khóa học đã được gợi ý
    related_courses = related_courses[related_courses['Recommended Course'] != recommended_course]
    return related_courses[['Learning Style', 'Recommended Course']]

# Ví dụ gọi hàm
learning_style_input = 'Visual'
interest_input = 'Sports'
recommended_course = recommend_course(learning_style_input, interest_input)
print(f"Recommended Course: {recommended_course}")

# Lấy và in ra các khóa học liên quan đến interest đã chọn
related_courses_df = get_related_courses(interest_input, recommended_course)
print(f"Courses related to {interest_input}:")
print(related_courses_df)


Accuracy: 86.21%
Recommended Course: Sports Analysis Videos, Play Diagrams
Courses related to Sports:
   Learning Style                           Recommended Course
22       Auditory  Sports Commentary, Play-by-Play Discussions
23        Logical             Sports Statistics, Game Strategy
