### **📌 מבוא ללמידת מכונה (Machine Learning)**

למידת מכונה היא תחום במדעי הנתונים שמאפשר למודלים ללמוד מדוגמאות ולהסיק תחזיות או תובנות מנתונים. 

- **למידה מפוקחת (Supervised Learning):** המודל לומד מתוך נתונים מתויגים.
- **למידה לא מפוקחת (Unsupervised Learning):** המודל מזהה דפוסים בנתונים לא מתויגים.
- **למידת חיזוק (Reinforcement Learning):** המודל מקבל חיזוקים על פעולות נכונות ולומד באמצעות ניסוי וטעייה.

📌 **נחקור שני סוגים עיקריים: למידה מפוקחת ולא מפוקחת.**

### **📌 למידה מפוקחת (Supervised Learning)**

בלמידה מפוקחת המודל לומד מתוך **נתונים מתויגים**, כלומר לכל תצפית קיים ערך תגובה (Label).

🔹 **שני סוגים עיקריים של למידה מפוקחת:**
1. **רגרסיה (Regression):** חיזוי ערכים רציפים (למשל, מחיר דירה).
2. **סיווג (Classification):** שיוך תצפיות לקטגוריות (למשל, זיהוי תמונות של חתולים וכלבים).

### **📌 דוגמה: חיזוי מחירי בתים באמצעות רגרסיה**

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# יצירת נתונים מלאכותיים
np.random.seed(42)
X = np.random.rand(100, 1) * 10  # שטח הבית (במ"ר)
y = 3 * X + 7 + np.random.randn(100, 1) * 2  # מחיר הבית עם רעש

# פיצול הנתונים לאימון ובדיקה
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# יצירת מודל רגרסיה לינארית
model = LinearRegression()
model.fit(X_train, y_train)

# תחזיות
y_pred = model.predict(X_test)

# חישוב שגיאת MSE
mse = mean_squared_error(y_test, y_pred)

# הצגת הנתונים והמודל
plt.figure(figsize=(8,6))
plt.scatter(X_test, y_test, color='blue', label='Real Prices')
plt.plot(X_test, y_pred, color='red', linewidth=2, label='Predicted Prices')
plt.xlabel('House Size (sqm)')
plt.ylabel('House Price')
plt.title('Linear Regression: House Price Prediction')
plt.legend()
plt.grid(True)
plt.show()

print(f'Mean Squared Error: {mse:.2f}')

### **📌 למידה לא מפוקחת (Unsupervised Learning)**

בלמידה לא מפוקחת אין תוויות לנתונים, והמודל מחפש דפוסים סמויים.

### **📌 דוגמה: קיבוץ נתונים (Clustering) באמצעות K-Means**

In [None]:
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs

# יצירת נתונים מלאכותיים
X, _ = make_blobs(n_samples=300, centers=3, random_state=42)

# יצירת מודל K-Means
kmeans = KMeans(n_clusters=3, random_state=42)
clusters = kmeans.fit_predict(X)

# הצגת הקבוצות
plt.figure(figsize=(8,6))
plt.scatter(X[:, 0], X[:, 1], c=clusters, cmap='viridis', edgecolor='black')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], c='red', marker='X', s=200, label='Centroids')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('K-Means Clustering')
plt.legend()
plt.grid(True)
plt.show()