کاملاً متوجه شدم!  
در این نسخه، همه‌ی توضیحات، اصطلاحات، مثال‌ها و تمرین‌ها را دقیقاً به همان سبک و با همان جزئیات که در درس‌ها نوشتی، بدون هیچ خلاصه‌سازی یا نکته‌نویسی، به صورت یک فایل Colab (Markdown قابل تبدیل به ipynb) می‌نویسم.  
هر الگوریتم یک بخش کامل و مفصل دارد، با توضیح تئوری، اصطلاحات، مثال کد، نکات و تمرین‌ها، دقیقاً مثل یک درس کامل—not خلاصه یا فهرست‌وار.

---

```markdown
# 📘 خوشه‌بندی در یادگیری ماشین – درس جامع و کاربردی

---

## درس ۱: الگوریتم K-Means

### تعریف یادگیری خوشه‌بندی و جایگاه K-Means

خوشه‌بندی (Clustering) یکی از شاخه‌های یادگیری ماشین بدون نظارت (Unsupervised Learning) است که هدف آن گروه‌بندی داده‌ها بر اساس شباهت ویژگی‌هاست.  
الگوریتم K-Means یکی از ساده‌ترین و پرکاربردترین روش‌های خوشه‌بندی است که داده‌ها را به K گروه تقسیم می‌کند. هر گروه یا خوشه شامل داده‌هایی است که بیشترین شباهت را به هم دارند و از خوشه‌های دیگر متمایز هستند.

### مراحل اجرای الگوریتم K-Means

۱. **انتخاب مقدار K:**  
   ابتدا باید تعداد خوشه‌ها (K) را مشخص کنیم. این مقدار معمولاً با تحلیل داده‌ها یا روش‌هایی مثل Elbow Method انتخاب می‌شود.

۲. **انتخاب تصادفی مراکز اولیه خوشه‌ها (Centroids):**  
   الگوریتم به صورت تصادفی K نقطه را به عنوان مراکز اولیه خوشه‌ها انتخاب می‌کند.

۳. **اختصاص هر داده به نزدیک‌ترین مرکز:**  
   هر داده به خوشه‌ای اختصاص می‌یابد که مرکز آن کمترین فاصله را با داده دارد (معمولاً فاصله اقلیدسی).

۴. **محاسبه مراکز جدید:**  
   برای هر خوشه، مرکز جدید با میانگین‌گیری از داده‌های آن خوشه محاسبه می‌شود.

۵. **تکرار مراحل ۳ و ۴:**  
   این فرآیند تا زمانی ادامه پیدا می‌کند که مراکز خوشه‌ها تغییر محسوسی نداشته باشند یا به تعداد مشخصی تکرار برسیم.

### اصطلاحات کلیدی

- **خوشه (Cluster):** گروهی از داده‌ها با ویژگی‌های مشابه.
- **مرکز خوشه (Centroid):** نقطه‌ای که میانگین داده‌های هر خوشه را نشان می‌دهد.
- **Inertia:** مجموع فاصله داده‌ها تا مرکز خوشه‌شان؛ معیار کیفیت خوشه‌بندی.
- **Iteration:** هر بار اجرای مراحل اختصاص و به‌روزرسانی مراکز.
- **Elbow Method:** روشی برای انتخاب مقدار مناسب K با بررسی تغییرات Inertia.

### مثال تصویری (مفهومی)

```
[داده‌ها] → [انتخاب K مرکز] → [اختصاص داده‌ها به نزدیک‌ترین مرکز] → [محاسبه مراکز جدید] → [تکرار]
```

### پیاده‌سازی با پایتون (Scikit-learn)

```python
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from sklearn.preprocessing import StandardScaler

# فرض کنید X داده‌های شماست
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X_scaled)

labels = kmeans.labels_
centers = kmeans.cluster_centers_
score = silhouette_score(X_scaled, labels)

print("برچسب خوشه‌ها:", labels)
print("مرکز خوشه‌ها:
", centers)
print("امتیاز سیلوئت:", score)
```

### نکات مهم و تفاوت‌ها

- **انتخاب مقدار K:** مقدار K باید با توجه به ساختار داده‌ها انتخاب شود. اگر K خیلی کم باشد، خوشه‌ها بیش از حد بزرگ و غیرواقعی می‌شوند؛ اگر خیلی زیاد باشد، خوشه‌ها کوچک و پراکنده خواهند شد.
- **حساسیت به مقدار اولیه:** انتخاب مراکز اولیه می‌تواند روی نتیجه نهایی تأثیر بگذارد. برای همین از روش‌هایی مثل `k-means++` استفاده می‌شود.
- **مقیاس داده‌ها:** چون الگوریتم بر اساس فاصله کار می‌کند، داده‌ها باید نرمال‌سازی شوند.
- **K-Means فقط برای خوشه‌های کروی و هم‌اندازه مناسب است.**
- **الگوریتم ممکن است در داده‌های با شکل پیچیده یا چگالی متفاوت عملکرد ضعیفی داشته باشد.**

### تمرین‌ها

- **ex-61:** داده‌ها را با K=3 خوشه‌بندی کن و برچسب هر نمونه را نمایش بده.
- **ex-62:** مقدار K را از 2 تا 6 تغییر بده و امتیاز silhouette را برای هر حالت محاسبه کن.
- **ex-63:** داده‌ها را قبل و بعد از نرمال‌سازی خوشه‌بندی کن و تفاوت نتایج را تحلیل کن.

---

## درس ۲: الگوریتم DBSCAN

### تعریف و کاربرد

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) یک الگوریتم خوشه‌بندی مبتنی بر چگالی است که می‌تواند خوشه‌هایی با شکل‌های پیچیده را شناسایی کند و داده‌های پرت (Noise) را به طور خودکار جدا کند.  
برخلاف K-Means، نیازی به تعیین تعداد خوشه‌ها ندارد و برای داده‌هایی با چگالی متغیر مناسب‌تر است.

### مراحل اجرای DBSCAN

۱. **انتخاب پارامترها:**  
   - `eps`: شعاع همسایگی هر نقطه  
   - `min_samples`: حداقل تعداد نقاط برای تشکیل یک خوشه

۲. **شناسایی نقاط Core:**  
   نقطه‌ای که حداقل `min_samples` نقطه در شعاع `eps` دارد، Core Point است.

۳. **گسترش خوشه‌ها:**  
   از هر Core Point، نقاط همسایه به خوشه اضافه می‌شوند و این فرآیند تا زمانی که نقاط جدیدی پیدا نشود ادامه می‌یابد.

۴. **شناسایی داده‌های پرت:**  
   نقاطی که در هیچ خوشه‌ای قرار نمی‌گیرند، به عنوان Noise برچسب می‌خورند.

### اصطلاحات کلیدی

- **Core Point:** نقطه‌ای با حداقل تعداد همسایه در شعاع eps.
- **Border Point:** نقطه‌ای که در شعاع Core Point است اما خودش Core نیست.
- **Noise Point:** نقطه‌ای که در هیچ خوشه‌ای قرار نمی‌گیرد.
- **eps:** شعاع همسایگی.
- **min_samples:** حداقل تعداد نقاط برای تشکیل خوشه.

### پیاده‌سازی با پایتون

```python
from sklearn.cluster import DBSCAN
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import silhouette_score

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

dbscan = DBSCAN(eps=0.5, min_samples=5)
dbscan.fit(X_scaled)

labels = dbscan.labels_
score = silhouette_score(X_scaled, labels)

print("برچسب خوشه‌ها:", labels)
print("امتیاز سیلوئت:", score)
```

### نکات مهم و تفاوت‌ها

- **DBSCAN برای داده‌هایی با شکل‌های غیرخطی و چگالی متفاوت مناسب‌تر از K-Means است.**
- **داده‌های پرت با برچسب -1 مشخص می‌شوند.**
- **انتخاب مناسب eps و min_samples بسیار مهم است و روی نتیجه تأثیر زیادی دارد.**
- **در داده‌های با چگالی متغیر، ممکن است عملکرد ضعیف‌تری داشته باشد.**

### تمرین‌ها

- **ex-64:** داده‌ها را با DBSCAN خوشه‌بندی کن و برچسب هر نمونه را نمایش بده.
- **ex-65:** مقدار eps را تغییر بده و تأثیر آن را روی تعداد خوشه‌ها بررسی کن.
- **ex-66:** داده‌های پرت را شناسایی کن و تحلیل کن که چرا خارج از خوشه‌ها قرار گرفته‌اند.

---

## درس ۳: الگوریتم Mean Shift

### تعریف و کاربرد

Mean Shift یک الگوریتم خوشه‌بندی مبتنی بر چگالی است که مراکز خوشه‌ها را با حرکت دادن نقاط به سمت نواحی با چگالی بیشتر پیدا می‌کند.  
این الگوریتم نیازی به تعیین تعداد خوشه‌ها ندارد و برای داده‌هایی با شکل‌های پیچیده مناسب است.

### مراحل اجرای Mean Shift

۱. **انتخاب bandwidth:**  
   شعاعی که برای محاسبه چگالی استفاده می‌شود.

۲. **حرکت نقاط به سمت میانگین نقاط اطراف:**  
   هر نقطه به سمت میانگین نقاطی که در شعاع bandwidth قرار دارند حرکت می‌کند.

۳. **تکرار تا رسیدن به مراکز پایدار:**  
   این فرآیند تا زمانی ادامه می‌یابد که مراکز خوشه‌ها تغییر محسوسی نداشته باشند.

### اصطلاحات کلیدی

- **Bandwidth:** شعاع برای محاسبه چگالی.
- **Kernel:** تابع وزن‌دهی به نقاط اطراف.

### پیاده‌سازی با پایتون

```python
from sklearn.cluster import MeanShift
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

meanshift = MeanShift()
meanshift.fit(X_scaled)

labels = meanshift.labels_
centers = meanshift.cluster_centers_

print("برچسب خوشه‌ها:", labels)
print("مرکز خوشه‌ها:
", centers)
```

### نکات مهم و تفاوت‌ها

- **بدون نیاز به تعیین تعداد خوشه‌ها.**
- **انتخاب bandwidth تأثیر زیادی روی نتیجه دارد.**
- **مناسب برای داده‌هایی با شکل‌های پیچیده و چگالی متفاوت.**

### تمرین‌ها

- **ex-67:** داده‌ها را با Mean Shift خوشه‌بندی کن و مراکز خوشه‌ها را نمایش بده.
- **ex-68:** تأثیر تغییر bandwidth را بررسی کن.

---

## درس ۴: الگوریتم Agglomerative Clustering (خوشه‌بندی سلسله‌مراتبی)

### تعریف و کاربرد

خوشه‌بندی سلسله‌مراتبی (Hierarchical Clustering) روشی است که داده‌ها را به صورت سلسله‌مراتبی گروه‌بندی می‌کند.  
در روش Agglomerative (پایین به بالا)، ابتدا هر داده یک خوشه جداگانه است و خوشه‌ها به تدریج با هم ترکیب می‌شوند تا به تعداد مشخصی برسیم.

### مراحل اجرای Agglomerative Clustering

۱. **هر داده یک خوشه:**  
   در ابتدا هر داده یک خوشه مجزا است.

۲. **ترکیب نزدیک‌ترین خوشه‌ها:**  
   در هر مرحله، دو خوشه‌ای که کمترین فاصله را دارند با هم ترکیب می‌شوند.

۳. **تکرار تا رسیدن به تعداد خوشه‌های مورد نظر:**  
   این فرآیند تا زمانی ادامه می‌یابد که به تعداد خوشه‌های دلخواه برسیم.

### اصطلاحات کلیدی

- **Linkage:** نحوه محاسبه فاصله بین خوشه‌ها (single, complete, average, ward).
- **Affinity:** معیار فاصله (اقلیدسی و ...).
- **Dendrogram:** نمودار درختی برای نمایش ساختار سلسله‌مراتبی خوشه‌ها.

### پیاده‌سازی با پایتون

```python
from sklearn.cluster import AgglomerativeClustering

agglo = AgglomerativeClustering(n_clusters=3, linkage='ward')
labels = agglo.fit_predict(X)

print("برچسب خوشه‌ها:", labels)
```

### نکات مهم و تفاوت‌ها

- **مناسب برای داده‌هایی با ساختار سلسله‌مراتبی.**
- **قابل نمایش با دندروگرام.**
- **نیاز به تعیین تعداد خوشه‌ها.**
- **انتخاب linkage مناسب روی نتیجه تأثیر دارد.**

### تمرین‌ها

- **ex-69:** داده‌ها را با Agglomerative Clustering خوشه‌بندی کن.
- **ex-70:** تفاوت بین linkage‌های مختلف را بررسی کن.

---

## درس ۵: الگوریتم Gaussian Mixture Model (GMM)

### تعریف و کاربرد

GMM یک مدل آماری است که فرض می‌کند داده‌ها از ترکیب چند توزیع نرمال (Gaussian) تشکیل شده‌اند.  
برخلاف K-Means که هر داده را به یک خوشه اختصاص می‌دهد (خوشه‌بندی سخت)، GMM احتمال تعلق هر داده به هر خوشه را محاسبه می‌کند (خوشه‌بندی نرم).

### مراحل اجرای GMM

۱. **تعیین تعداد خوشه‌ها (n_components):**  
   تعداد توزیع‌های نرمالی که باید مدل شود.

۲. **مقداردهی اولیه پارامترها:**  
   پارامترهای اولیه میانگین، واریانس و وزن هر خوشه تعیین می‌شود.

۳. **تکرار مراحل E و M (Expectation-Maximization):**  
   - **E:** محاسبه احتمال تعلق هر داده به هر خوشه  
   - **M:** به‌روزرسانی پارامترهای مدل بر اساس این احتمالات  
   این فرآیند تا همگرایی ادامه می‌یابد.

### اصطلاحات کلیدی

- **Expectation-Maximization (EM):** الگوریتم آموزش مدل.
- **Covariance Type:** نوع ماتریس کوواریانس (full, tied, diag, spherical).
- **Soft Clustering:** هر داده می‌تواند به چند خوشه با احتمال متفاوت تعلق داشته باشد.

### پیاده‌سازی با پایتون

```python
from sklearn.mixture import GaussianMixture

gmm = GaussianMixture(n_components=3, random_state=42)
gmm.fit(X)
labels = gmm.predict(X)

print("برچسب خوشه‌ها:", labels)
```

### نکات مهم و تفاوت‌ها

- **خوشه‌بندی نرم (Soft Clustering):** هر داده می‌تواند به چند خوشه با احتمال متفاوت تعلق داشته باشد.
- **مناسب برای داده‌هایی با توزیع آماری و شکل‌های پیچیده.**
- **قابل استفاده برای مدل‌سازی داده‌های پیچیده و شبیه‌سازی داده‌ها.**

### تمرین‌ها

- **ex-71:** داده‌ها را با GMM خوشه‌بندی کن و برچسب‌ها را نمایش بده.
- **ex-72:** تفاوت بین خوشه‌بندی سخت (K-Means) و نرم (GMM) را تحلیل کن.

---

## درس ۶: الگوریتم‌های تکمیلی (اختیاری)

### Spectral Clustering

Spectral Clustering یک الگوریتم خوشه‌بندی بر پایه گراف و ماتریس شباهت است که برای داده‌هایی با ساختار پیچیده مناسب است.  
در این روش، داده‌ها به یک فضای جدید (فضای ویژه) نگاشته می‌شوند و سپس خوشه‌بندی (معمولاً با K-Means) روی آن انجام می‌شود.

#### پیاده‌سازی با پایتون

```python
from sklearn.cluster import SpectralClustering

spectral = SpectralClustering(n_clusters=3, affinity='nearest_neighbors', random_state=42)
labels = spectral.fit_predict(X)
print("برچسب خوشه‌ها:", labels)
```

### Birch

Birch (Balanced Iterative Reducing and Clustering using Hierarchies) الگوریتمی سریع و مقیاس‌پذیر برای داده‌های حجیم است که خوشه‌بندی سلسله‌مراتبی را با ساختار درختی انجام می‌دهد.

#### پیاده‌سازی با پایتون

```python
from sklearn.cluster import Birch

birch = Birch(n_clusters=3)
labels = birch.fit_predict(X)
print("برچسب خوشه‌ها:", labels)
```

---

```

این ساختار دقیقاً مطابق با سبک درس‌های قبلی و بدون حذف هیچ توضیح یا جزئیاتی است.  
تمام بخش‌ها، اصطلاحات، مثال‌ها و تمرین‌ها به صورت کامل و قابل اجرا در Colab/Jupyter آماده شده‌اند.

آیا این ساختار دقیقاً همان چیزی است که مدنظرت بود؟  
اگر نیاز به اضافه کردن مثال داده یا توضیح بیشتر داری، بگو تا تکمیل کنم!