In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

# قراءة البيانات
data = pd.read_csv('Feedback_answers.csv')

# تحويل الفئات النصية إلى أرقام
label_encoder = LabelEncoder()

# تحويل SleepQuality باستخدام LabelEncoder
data['SleepQuality'] = label_encoder.fit_transform(data['SleepQuality'])

# تحويل باقي الأعمدة النصية باستخدام pd.get_dummies
categorical_cols = ['Q1', 'Q2', 'Q3', 'Q4', 'Q5', 'Q6', 'Q7']
data = pd.get_dummies(data, columns=categorical_cols)

# تقسيم البيانات إلى مدخلات ومخرجات
X = data.drop(['SleepQuality', 'UserID', 'Date'], axis=1)
y = data['SleepQuality']

# تقسيم البيانات إلى مجموعة تدريب واختبار
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# تدريب نموذج RandomForestClassifier
model = RandomForestClassifier()
model.fit(X_train, y_train)

# التنبؤ على مجموعة الاختبار
y_pred = model.predict(X_test)

# الحصول على الفئات الفعلية
actual_classes = label_encoder.classes_[y_test.unique()]

# تقييم النموذج
print(classification_report(y_test, y_pred, target_names=actual_classes))

              precision    recall  f1-score   support

     Average       0.88      0.88      0.88        32
        Poor       0.82      0.90      0.86        10
        Good       0.88      0.83      0.86        18

    accuracy                           0.87        60
   macro avg       0.86      0.87      0.86        60
weighted avg       0.87      0.87      0.87        60



In [2]:
from sklearn.model_selection import GridSearchCV

# تعريف مجموعة المعلمات للتجربة
param_grid = {
    'n_estimators': [50, 100, 200],
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 5, 10]
}

# إنشاء نموذج GridSearchCV
grid_search = GridSearchCV(estimator=RandomForestClassifier(), param_grid=param_grid, cv=5, scoring='accuracy')

# تدريب النموذج
grid_search.fit(X_train, y_train)

# الحصول على أفضل المعلمات
best_params = grid_search.best_params_
print("أفضل المعلمات: ", best_params)

# استخدام أفضل معلمات لتدريب النموذج النهائي
best_model = grid_search.best_estimator_

# التنبؤ وتقييم النموذج
y_pred_best = best_model.predict(X_test)
print(classification_report(y_test, y_pred_best, target_names=actual_classes))




أفضل المعلمات:  {'max_depth': 10, 'min_samples_split': 2, 'n_estimators': 200}
              precision    recall  f1-score   support

     Average       0.97      1.00      0.98        32
        Poor       1.00      0.90      0.95        10
        Good       1.00      1.00      1.00        18

    accuracy                           0.98        60
   macro avg       0.99      0.97      0.98        60
weighted avg       0.98      0.98      0.98        60



In [3]:
# تحضير المدخلات الجديدة
# answers = ['No', 'No', 'No', 'Quiet', 'Cool', 'No', 'No']
# answers = ['No', 'No', 'No', 'Quiet', 'Hot', 'Yes', 'No']
# answers = answers =['No', 'No', 'No', 'Quiet', 'Warm', 'No', 'Yes']
answers =   ['No', 'Yes', 'Yes', 'Moderately noisy', 'Cool', 'Yes', 'No']
# answers =   ['No', 'Yes', 'Yes', 'Moderately noisy', 'Hot', 'No', 'Yes']
# تحويل المدخلات إلى نفس التنسيق المستخدم في التدريب
input_data = {
    'Q1': [answers[0]],
    'Q2': [answers[1]],
    'Q3': [answers[2]],
    'Q4': [answers[3]],
    'Q5': [answers[4]],
    'Q6': [answers[5]],
    'Q7': [answers[6]]
}

input_df = pd.DataFrame(input_data)
input_df = pd.get_dummies(input_df)

# ضمان أن تكون الأعمدة في المدخلات الجديدة تتطابق مع الأعمدة المستخدمة في التدريب
missing_cols = set(X.columns) - set(input_df.columns)
for col in missing_cols:
    input_df[col] = 0
input_df = input_df[X.columns]


In [4]:
# تنفيذ التنبؤ
predicted_quality_encoded = best_model.predict(input_df)

# تحويل التنبؤ إلى التصنيف الأصلي
predicted_quality = label_encoder.inverse_transform(predicted_quality_encoded)

print(f"Predicted Sleep Quality: {predicted_quality[0]}")


Predicted Sleep Quality: Average


In [5]:
import joblib

# حفظ النموذج المدرب
joblib.dump(best_model, 'best_model.pkl')

# حفظ الـ LabelEncoder
joblib.dump(label_encoder, 'label_encoder.pkl')

['label_encoder.pkl']

In [20]:
from huggingface_hub import HfApi, HfFolder, Repository

# تسجيل الدخول إلى Hugging Face
api = HfApi()
token = "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"
HfFolder.save_token(token)

# إنشاء مستودع جديد
repo_name = "my_sleepwell_quality_model"
repo_url = api.create_repo(repo_name)

# نشر الملفات إلى المستودع
repo = Repository(local_dir=repo_name, clone_from=repo_url)
repo.git_pull()

# نسخ الملفات المحفوظة إلى المستودع
import shutil

shutil.copy('best_model.pkl', repo_name)
shutil.copy('label_encoder.pkl', repo_name)

# رفع الملفات إلى المستودع
repo.git_add(auto_lfs_track=True)
repo.git_commit("Initial commit with model files")
repo.git_push()


  from .autonotebook import tqdm as notebook_tqdm
For more details, please read https://huggingface.co/docs/huggingface_hub/concepts/git_vs_http.
Cloning https://huggingface.co/TaifAlrubeaan/my_sleepwell_quality_model into local empty directory.
Upload file best_model.pkl:  41%|████▏     | 1.00M/2.41M [00:01<00:01, 1.01MB/s]To https://huggingface.co/TaifAlrubeaan/my_sleepwell_quality_model
   77c0962..92c2885  main -> main

Upload file best_model.pkl: 100%|██████████| 2.41M/2.41M [00:04<00:00, 616kB/s] 
Upload file label_encoder.pkl: 100%|██████████| 570/570 [00:04<?, ?B/s]


'https://huggingface.co/TaifAlrubeaan/my_sleepwell_quality_model/commit/92c2885d08cb7467e2d7ff834d1ab7d731e7b2e4'

In [26]:
import requests
import joblib
import pandas as pd

# URLs الخاصة بالنموذج والـ LabelEncoder على Hugging Face
model_url = "https://huggingface.co/TaifAlrubeaan/my_sleepwell_quality_model/resolve/main/best_model.pkl"
label_encoder_url = "https://huggingface.co/TaifAlrubeaan/my_sleepwell_quality_model/resolve/main/label_encoder.pkl"

# تحميل النموذج والـ LabelEncoder
model_response = requests.get(model_url)
label_encoder_response = requests.get(label_encoder_url)

# حفظ الملفات المحملة
with open('best_model.pkl', 'wb') as f:
    f.write(model_response.content)

with open('label_encoder.pkl', 'wb') as f:
    f.write(label_encoder_response.content)

# تحميل النموذج والـ LabelEncoder من الملفات المحفوظة
model = joblib.load('best_model.pkl')
label_encoder = joblib.load('label_encoder.pkl')

# تحضير المدخلات الجديدة
# answers = ['No', 'No', 'No', 'Quiet', 'Cool', 'No', 'No']
# answers = ['No', 'No', 'No', 'Quiet', 'Cool', 'No', 'No']
# answers = ['No', 'No', 'No', 'Quiet', 'Hot', 'Yes', 'No']
answers = answers =['No', 'No', 'No', 'Quiet', 'Warm', 'No', 'Yes']
# answers =   ['No', 'Yes', 'Yes', 'Moderately noisy', 'Cool', 'Yes', 'No']
# answers =   ['No', 'Yes', 'Yes', 'Moderately noisy', 'Hot', 'No', 'Yes']
input_data = {
    'Q1': [answers[0]],
    'Q2': [answers[1]],
    'Q3': [answers[2]],
    'Q4': [answers[3]],
    'Q5': [answers[4]],
    'Q6': [answers[5]],
    'Q7': [answers[6]]
}
input_df = pd.DataFrame(input_data)
input_df = pd.get_dummies(input_df)

# ضمان أن تكون الأعمدة في المدخلات الجديدة تتطابق مع الأعمدة المستخدمة في التدريب
missing_cols = set(model.feature_names_in_) - set(input_df.columns)
for col in missing_cols:
    input_df[col] = 0
input_df = input_df[model.feature_names_in_]

# تنفيذ التنبؤ
predicted_quality_encoded = model.predict(input_df)
predicted_quality = label_encoder.inverse_transform(predicted_quality_encoded)

print(f"Predicted Sleep Quality: {predicted_quality[0]}")

Predicted Sleep Quality: Good
