# 📌 What is Voting in Ensemble Learning?

**Voting** is one of the **Ensemble Learning** techniques, where multiple **different models** are combined to make a final decision based on their votes. It is mainly used in **classification tasks**.

---

## 🛠️ Types of Voting
There are two main types of **Voting**:

### 1️⃣ Hard Voting
- Each model votes for the class it predicts.
- The class with the **most votes** is selected as the final prediction.

#### Example:
If we have three models, and they produce the following predictions:
- Model 1: **"Cat"**
- Model 2: **"Dog"**
- Model 3: **"Cat"**

**➜ Final result = "Cat"** (since it has the most votes).

✅ Reduces variance and makes the model more stable.  
❌ Does not consider the confidence level of each model’s prediction.

---

### 2️⃣ Soft Voting
- Uses the **probability predictions** from each model.
- The class with the **highest average probability** is selected as the final prediction.

#### Example:
If the models provide the following probability scores for each class:

| Model   | Cat | Dog |
|---------|-----|-----|
| Model 1 | 0.8 | 0.2 |
| Model 2 | 0.6 | 0.4 |
| Model 3 | 0.7 | 0.3 |

- **Average probability for "Cat"** = (0.8 + 0.6 + 0.7) / 3 = **0.7**
- **Average probability for "Dog"** = (0.2 + 0.4 + 0.3) / 3 = **0.3**

**➜ Final result = "Cat"** (since it has the highest probability).

✅ More accurate than **Hard Voting** as it considers the confidence level of each model.  
❌ Requires models that support probability predictions (e.g., **SVM with `probability=True`**).

---

## 📌 When to Use Voting?
- When combining **several strong but different models** (e.g., **SVM, Random Forest, Neural Networks**).
- To **improve overall performance** and leverage the strengths of each model.
- If individual models provide **similar results**, combining them may lead to **a slight or significant accuracy improvement**.


In [1]:
from sklearn.ensemble import VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# تحميل البيانات
iris = load_iris()
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

# إنشاء النماذج الفردية
model1 = LogisticRegression()
model2 = DecisionTreeClassifier()
model3 = SVC(probability=True)  # مطلوب لـ Soft Voting

# إنشاء نموذج Voting (التصويت الصلب)
voting_hard = VotingClassifier(estimators=[
    ('lr', model1), ('dt', model2), ('svc', model3)], voting='hard')

# تدريب النموذج
voting_hard.fit(X_train, y_train)

# اختبار النموذج
y_pred = voting_hard.predict(X_test)
print(f'Hard Voting Accuracy: {accuracy_score(y_test, y_pred):.4f}')

# إنشاء نموذج Voting (التصويت الناعم)
voting_soft = VotingClassifier(estimators=[
    ('lr', model1), ('dt', model2), ('svc', model3)], voting='soft')

# تدريب النموذج
voting_soft.fit(X_train, y_train)

# اختبار النموذج
y_pred = voting_soft.predict(X_test)
print(f'Soft Voting Accuracy: {accuracy_score(y_test, y_pred):.4f}')


Hard Voting Accuracy: 1.0000
Soft Voting Accuracy: 1.0000


# 📌 ما هو Voting في التعلم الجماعي (Ensemble Learning)؟

**Voting** هو إحدى طرق **التعلم الجماعي (Ensemble Learning)**، حيث يتم الجمع بين **عدة نماذج مختلفة** لاتخاذ قرار نهائي بناءً على تصويتهم. يُستخدم بشكل رئيسي في **تصنيف البيانات (Classification)**.

---

## 🛠️ أنواع Voting
هناك نوعان أساسيان من **Voting**:

### 1️⃣ Hard Voting (التصويت الصلب)
- كل نموذج يصوت للنتيجة التي يعتقد أنها صحيحة.
- يتم اختيار الفئة (**class**) التي حصلت على **أغلب الأصوات**.

#### مثال:
إذا كانت لدينا 3 نماذج، وأنتجت التنبؤات التالية:
- النموذج 1: **"قط"**
- النموذج 2: **"كلب"**
- النموذج 3: **"قط"**

**➜ النتيجة النهائية = "قط"** (لأنها حصلت على أكثر الأصوات).

✅ يقلل التباين، ويجعل النموذج أكثر استقرارًا.  
❌ لا يأخذ في الاعتبار مدى ثقة النماذج في تنبؤاتها.

---

### 2️⃣ Soft Voting (التصويت الناعم)
- يعتمد على **احتمالات التنبؤات** التي يقدمها كل نموذج.
- يتم حساب المتوسط لهذه الاحتمالات، والفئة ذات **أعلى متوسط احتمال** يتم اختيارها.

#### مثال:
إذا كانت النماذج تعطي الاحتمالات التالية للفئات:

| النموذج  | قط  | كلب  |
|----------|----|----|
| نموذج 1  | 0.8  | 0.2  |
| نموذج 2  | 0.6  | 0.4  |
| نموذج 3  | 0.7  | 0.3  |

- **متوسط الاحتمال لـ "قط"** = (0.8 + 0.6 + 0.7) / 3 = **0.7**
- **متوسط الاحتمال لـ "كلب"** = (0.2 + 0.4 + 0.3) / 3 = **0.3**

**➜ النتيجة النهائية = "قط"** (لأنها حصلت على أعلى احتمال).

✅ أكثر دقة من **Hard Voting** لأنه يأخذ في الاعتبار مدى ثقة كل نموذج.  
❌ يتطلب أن تدعم النماذج التنبؤات الاحتمالية (مثل **SVM مع `probability=True`**).

---

## 📌 متى نستخدم Voting؟
- عند وجود **عدة نماذج قوية لكنها مختلفة** (مثل **SVM, Random Forest, Neural Networks**).
- عندما نريد **تحسين الأداء العام** والاستفادة من نقاط القوة لكل نموذج.
- إذا كانت النماذج الفردية تقدم **نتائج متقاربة**، فإن الجمع بينها قد يؤدي إلى **تحسن طفيف أو كبير في الدقة**.
