<a href="https://colab.research.google.com/github/ReemAlbluwi/Machine-Learning---T5/blob/main/Getting_Started_Machine_Learning_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##1.Fitting and predicting: estimator basics

#1- 1 : Import the library to get the model:

In [None]:
from sklearn.ensemble import RandomForestClassifier

# إنشاء نموذج RandomForestClassifier
clf = RandomForestClassifier(random_state=0)


##1-2: Data definition:

In [9]:
# البيانات: عينتين، 3 ميزات
X = [[1, 2, 3],
     [11, 12, 13]]

# التصنيفات لكل عينة
y = [0, 1]


# 1-3 : Model training:

In [10]:
# تدريب النموذج
clf.fit(X, y)


#1-3 : Show the trained model:

In [11]:
print(clf)


RandomForestClassifier(random_state=0)


In [12]:
# التنبؤ بفئات بيانات جديدة
predictions = clf.predict([[5, 6, 7], [15, 16, 17]])
print(predictions)


[0 1]


In [13]:
clf.predict(X)  # يتوقع: [0, 1]


array([0, 1])

In [14]:
clf.predict([[4, 5, 6], [14, 15, 16]])  # يتوقع: [0, 1]


array([0, 1])

## 2 : Transformers and pre-processors

In [15]:
from sklearn.preprocessing import StandardScaler

# تعريف البيانات
X = [[0, 15],
     [1, -10]]

# إنشاء كائن StandardScaler وتدريب النموذج عليه
scaler = StandardScaler()
scaler.fit(X)

# تطبيق التقييس على البيانات
scaled_X = scaler.transform(X)

# عرض البيانات بعد التقييس
print(scaled_X)


[[-1.  1.]
 [ 1. -1.]]


## 3: Pipelines: chaining pre-processors and estimators

In [16]:
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import make_pipeline
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# إنشاء كائن Pipeline يتضمن تقييس البيانات باستخدام StandardScaler
# وتطبيق الانحدار اللوجستي باستخدام LogisticRegression
pipe = make_pipeline(
    StandardScaler(),
    LogisticRegression()
)

# تحميل مجموعة بيانات الأيريس وتقسيمها إلى بيانات وملصقات
X, y = load_iris(return_X_y=True)

# تقسيم البيانات إلى مجموعة تدريب واختبار
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

# تدريب النموذج باستخدام البيانات التدريبية
pipe.fit(X_train, y_train)

# حساب دقة النموذج على مجموعة الاختبار
accuracy = accuracy_score(pipe.predict(X_test), y_test)

# عرض دقة النموذج
print("Accuracy:", accuracy)


Accuracy: 0.9736842105263158


##  4 : Model evaluation

In [17]:
from sklearn.datasets import make_regression
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import cross_validate

# إنشاء مجموعة بيانات وهمية للانحدار
X, y = make_regression(n_samples=1000, random_state=0)

# إنشاء نموذج الانحدار الخطي
lr = LinearRegression()

# تنفيذ التحقق المتقاطع (بخمس طيات افتراضيًا)
result = cross_validate(lr, X, y)  # defaults to 5-fold CV

# عرض درجات التقييم (R²) لكل طية
print("Cross-Validation Scores:", result['test_score'])


Cross-Validation Scores: [1. 1. 1. 1. 1.]


## 5 : Automatic parameter searches

In [18]:
from sklearn.datasets import fetch_california_housing
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import RandomizedSearchCV
from sklearn.model_selection import train_test_split
from scipy.stats import randint

# تحميل مجموعة بيانات الإسكان في كاليفورنيا
X, y = fetch_california_housing(return_X_y=True)

# تقسيم البيانات إلى مجموعة تدريب واختبار
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

# تعريف المساحة التي سيتم البحث فيها
param_distributions = {
    'n_estimators': randint(1, 5),   # عدد الأشجار في الغابة العشوائية
    'max_depth': randint(5, 10)      # أقصى عمق لكل شجرة
}

# إنشاء كائن RandomizedSearchCV والبحث عن أفضل معلمات
search = RandomizedSearchCV(
    estimator=RandomForestRegressor(random_state=0),
    n_iter=5,                           # عدد التكرارات للبحث
    param_distributions=param_distributions,
    random_state=0
)

# تدريب النموذج باستخدام مجموعة التدريب
search.fit(X_train, y_train)

# عرض أفضل المعلمات التي تم العثور عليها
print("Best Parameters:", search.best_params_)

# حساب دقة النموذج على مجموعة الاختبار
score = search.score(X_test, y_test)
print("Test Score:", score)


Best Parameters: {'max_depth': 9, 'n_estimators': 4}
Test Score: 0.735363411343253
