<div dir="rtl" align="right">

# 📘 Heap و Priority Queue (جلسه L0-S3-2)

در این بخش با ساختار داده‌ی **Heap** و پیاده‌سازی آن در پایتون آشنا می‌شویم.  
Heap اساس بسیاری از الگوریتم‌های اولویت‌محور مثل Dijkstra و مدیریت صف‌های اولویت است.

---

## 🔹 Heap چیست؟
- **Heap** یک درخت دودویی کامل (Complete Binary Tree) است.  
- در **Min-Heap**، هر گره از والدینش بزرگ‌تر یا مساوی است (ریشه کوچک‌ترین عنصر).  
- در **Max-Heap**، هر گره از والدینش کوچک‌تر یا مساوی است (ریشه بزرگ‌ترین عنصر).  

📌 **ویژگی مهم:**  
درخت باید **کامل** باشد → پر شدن از **چپ به راست** در هر سطح.  
مثال نادرست: گره‌ای دو فرزند داشته باشد در حالی که گره‌ی کناری هنوز فرزند ندارد.

---

## 🔹 نگاشت در Heap (ایندکس در لیست)
پایتون Heap را روی یک لیست پیاده‌سازی می‌کند.  
اگر عنصر ریشه در اندیس `i` باشد:
- فرزند چپ = `2*i + 1`
- فرزند راست = `2*i + 2`
- والد = `(i-1)//2`

---

## 🔹 پیچیدگی زمانی
- `heapify` → O(n)
- `heappush` / `heappop` → O(log n)

---

## 🔹 کتابخانه heapq
پایتون ماژول `heapq` را برای کار با Heap فراهم می‌کند.

</div>


In [None]:
import heapq

nums = [8, 12, 4, 16, 20]
heapq.heapify(nums)
print("Heap:", nums)

heapq.heappush(nums, 10)
print("بعد از push:", nums)

min_val = heapq.heappop(nums)
print("pop:", min_val)
print("Heap بعد از pop:", nums)

In [None]:
# Max-Heap با منفی کردن اعداد
nums = [8, 12, 4, 16, 20]
max_heap = [-n for n in nums]
heapq.heapify(max_heap)

print("Max-Heap:", max_heap)
print("بزرگ‌ترین عنصر:", -heapq.heappop(max_heap))

In [None]:
# Priority Queue
tasks = []
heapq.heappush(tasks, (2, "نوشتن گزارش"))
heapq.heappush(tasks, (1, "رفع باگ"))
heapq.heappush(tasks, (3, "خواندن ایمیل"))

while tasks:
    priority, task = heapq.heappop(tasks)
    print(f"انجام وظیفه: {task} (اولویت {priority})")

<div dir="rtl" align="right">

## 🔹 سطح پیشرفته‌تر

### 1. چرا Heap وقتی sort داریم؟
- اگر داده از قبل **کاملاً مرتب** باشد → Heap مزیتی ندارد.  
- اما در حالت‌های معمول داده نامرتب یا جریان (stream) وارد می‌شود.  
- مثال: پیدا کردن **k عنصر بزرگ**:
  - مرتب‌سازی کامل: `O(n log n)`  
  - Min-Heap با سایز k: `O(n log k)` (خیلی سریع‌تر اگر `k ≪ n`)  
- مثال Median: مرتب‌سازی کامل هر بار `O(n log n)`، ولی دو Heap → `O(log n)` در هر مرحله.

---

### 2. پایداری (Stability)
- Heap فقط تضمین می‌کند **ریشه کوچک‌ترین/بزرگ‌ترین عنصر است**.  
- برای عناصر با اولویت برابر، ترتیب ورود تضمین نمی‌شود.  
- برای Priority Queue پایدار → اضافه کردن شمارنده‌ی افزایشی یا `dataclass(order=True)`.

---

### 3. Heap یک ساختار داده یا فقط لیست؟
- در پایتون `heapq` فقط یک **لیست** است که propertyهای Heap روی آن اعمال می‌شود.  
- هیچ **metadata اضافی** (مثل اشاره‌گر به پدر/فرزند) ذخیره نمی‌شود.  
- پس: از دید کاربر = **ساختار داده انتزاعی (ADT)** → Binary Heap.  
- از دید پیاده‌سازی پایتون = فقط یک `list`.  

---

### 4. Heap vs Tree Balancing
- Heap = درخت دودویی کامل (Complete) → همه سطح‌ها پر، سطح آخر از چپ پر می‌شود.  
- Heap **بالانس‌شده** به معنای AVL یا Red-Black نیست.  
- انواع درخت‌ها:
  - **AVL Tree**: height-balanced → تضمین O(log n).  
  - **Red-Black Tree**: relax‌تر ولی سریع‌تر برای درج/حذف.  
  - **B-Tree**: برای ذخیره‌سازی در دیتابیس/فایل.  
- در پایتون: فقط `heapq` و ابزارهایی مثل `bisect`. درخت‌های بالانس‌شده باید از کتابخانه‌های خارجی استفاده شوند.

---

### 5. چرا Heap وقتی sort داریم؟
- برای کار یک‌باره (کل داده) → مرتب‌سازی مناسب‌تر.  
- برای داده پویا یا بخشی از داده → Heap بهینه‌تر.  

**مثال‌ها:**  
- **Streaming Median** → Heap بهتر.  
- **Top-k** → Heap بهتر (O(n log k) vs O(n log n)).  
- **Dijkstra** → Heap بهتر برای به‌روزرسانی مسیرها.  
- **Huffman Coding** → Heap برای ادغام کارآمد گره‌ها.  

---

## 📌 جمع‌بندی
Heap همیشه بهترین نیست:  
- مرتب‌سازی → وقتی همه داده مهم است.  
- Heap → وقتی فقط بخش کوچکی مهم است یا داده جریان دارد.  

</div>

</div>


<div dir="rtl" align="right">

# 🧪 تمرین‌های Heap و Priority Queue — L0-S3-2 (از ex19)

در این نوت‌بوک، تمرین‌های مرتبط با **Heap / Priority Queue** از شماره **ex19** به بعد قرار داده شده‌اند.  
طبق روال:
- ابتدا صورت مسئله در یک سلول **Markdown راست‌چین** می‌آید،
- سپس یک سلول **کد** خالی برای پیاده‌سازی تو قرار دارد،
- در انتها (پس از ارسال پاسخ‌ها) نسخه‌ی جامع نوت‌بوک با «حل ایمان» و «حل حرفه‌ای» ساخته خواهد شد.

</div>


<div dir="rtl" align="right">

## ex19 — ساخت Min-Heap و بررسی نگاشت والد/فرزند
1) لیست `nums = [8, 12, 4, 16, 20, 6, 2, 14]` را به **Min-Heap** تبدیل کن (`heapq.heapify`).
2) توالی `heappop` را تا خالی‌شدن کامل هیپ چاپ کن.
3) برای آرایه‌ی هیپ‌شده، برای هر اندیس `i` (تا جایی که بچه دارد) **ایندکس والد و فرزندان** را حساب کن و به‌صورت جفت‌های `(i, parent(i), left(i), right(i))` چاپ کن.
4) توضیح بده چرا این ساختار **درخت دودویی کامل** محسوب می‌شود (دو جمله‌ی دقیق).

نکته: فرمول‌ها — `parent(i)=(i-1)//2`، `left(i)=2*i+1`، `right(i)=2*i+2`.

</div>


In [None]:
# کد ex19 را اینجا بنویس
import heapq


<div dir="rtl" align="right">

## ex20 — پیاده‌سازی Max-Heap کلاس‌محور
کلاسی بنویس به‌نام `MaxHeap` که با استفاده از `heapq` و **منفی‌کردن** مقادیر، رفتار **Max-Heap** را ارائه دهد.
حداقل متدها:
- `__init__(self, iterable=None)`
- `push(self, value)`
- `pop(self) -> int` → بزرگ‌ترین مقدار
- `peek(self) -> int` → مشاهده‌ی ریشه بدون حذف
- `__len__(self) -> int`
- `heapify(self, iterable)`

الزامی: **type hint** ها را رعایت کن و در docstring هر متد پیچیدگی زمانی آن را بنویس (`O(log n)`، `O(n)`، ...).
یک تست کوتاه بنویس که صحت رفتار را نشان دهد.

</div>


In [None]:
# کد ex20 را اینجا بنویس
from __future__ import annotations
import heapq
from typing import Iterable, Optional


<div dir="rtl" align="right">

## ex21 — Priority Queue پایدار (Stable)
یک صف اولویت بساز که برای **اولویت‌های برابر**، **ترتیب ورود** را حفظ کند (Stable).
دو رویکرد را پیاده‌سازی کن:
1) استفاده از **tuple سه‌تایی** `(priority, seq, item)` که `seq` یک شمارنده‌ی افزایشی است.
2) استفاده از **@dataclass(order=True)** با فیلدهای مناسب.
برای هر رویکرد ۵ کار با اولویت‌های تکراری اضافه کن و ترتیب خروج را چاپ کن.

</div>


In [None]:
# کد ex21 را اینجا بنویس
from dataclasses import dataclass, field
import itertools
import heapq


<div dir="rtl" align="right">

## ex22 — میانهٔ جاری (Running Median) با دو Heap
جریانی از اعداد صحیح را دریافت کن و در هر مرحله **میانه** را برگردان.
راهنما: از دو هیپ استفاده کن — **Max-Heap** برای نیمه‌ی پایین و **Min-Heap** برای نیمه‌ی بالا؛ اندازه‌ها را طوری متوازن نگه‌دار که اختلاف حداکثر ۱ باشد.
یک تابع با امضای زیر پیاده‌سازی کن و با چند جریان تست کن:
```
def running_median(stream: list[int]) -> list[float]:
    ...
```

</div>


In [None]:
# کد ex22 را اینجا بنویس
import heapq
from typing import List


<div dir="rtl" align="right">

## ex23 — ادغام k لیست مرتب (Merge k Sorted Lists)
`k` لیست **از قبل مرتب** داده شده است. با استفاده از یک **Min-Heap**، همه را در یک لیست **مرتب** ادغام کن.
تابع زیر را بنویس و پیچیدگی زمانی را تحلیل کن (بر حسب `n` مجموع طول‌ها و `k` تعداد لیست‌ها):
```
def merge_k_sorted(lists: list[list[int]]) -> list[int]:
    ...
```

**محدودیت:** از `heapq.merge` استفاده نکن؛ خودت با `heappush/heappop` پیاده‌سازی کن.

</div>


In [None]:
# کد ex23 را اینجا بنویس
import heapq
from typing import List


<div dir="rtl" align="right">

## ex24 — Top-K: بزرگ‌ترین k عنصر
تابعی بنویس که بزرگ‌ترین `k` عنصر یک آرایه‌ی بزرگ تصادفی را برگرداند.
سه روش را مقایسه کن:
1) `heapq.nlargest(k, arr)`
2) ساخت Min-Heap با اندازه‌ی ثابت `k` و نگه‌داشتن آن
3) مرتب‌سازی کامل و برداشتن آخرین k عنصر

با `timeit` روی آرایه‌هایی با اندازه‌های مختلف (مثلاً `10**5` و `5*10**5`) زمان‌ها را مقایسه کن و نتایج را چاپ کن.

</div>


In [None]:
# کد ex24 را اینجا بنویس
import random, timeit, heapq


<div dir="rtl" align="right">

## ex25 — دایکسترا (نسخهٔ کوچک) با Heap
یک گراف وزن‌دار کوچک (بدون وزن منفی) را با دیکشنری از همسایه‌ها نمایش بده و **کوتاه‌ترین مسیر** از یک مبدأ به همه‌ی رئوس را با الگوریتم **Dijkstra** و **Min-Heap** محاسبه کن.
امضای تابع:
```
def dijkstra(graph: dict[str, dict[str, int]], source: str) -> dict[str, int]:
    ...
```
یک گراف نمونه بساز و خروجی‌ها را با چند `assert` بررسی کن.

</div>


In [None]:
# کد ex25 را اینجا بنویس
import heapq
from typing import Dict


<div dir="rtl" align="right">

---

## 📝 سؤالات تشریحی (برای انتهای جلسه)
1) چرا ساختار آرایه‌ای Heap معادل یک **درخت دودویی کامل** است؟ نگاشت اندیس‌ها به والد/فرزند را دقیق توضیح بده.
2) تفاوت `heapify` با توالی `heappush` برای ساخت هیپ چیست از نظر پیچیدگی زمانی و رفتار؟
3) چرا برای پیاده‌سازی **Max-Heap** معمولاً از منفی‌کردن اعداد استفاده می‌کنیم؟ مزایا/معایب؟
4) در صف اولویت **پایدار**، چگونه تعارض اولویت‌های مساوی را حل می‌کنیم و چرا مهم است؟
5) در **Running Median** چرا به دو هیپ نیاز داریم و چگونه عدم‌تعادل اندازه‌ها را مدیریت می‌کنیم؟
6) پیچیدگی زمانی ادغام `k` لیست مرتب با هیپ چیست و چه زمانی از `k-way merge` نسبت به ادغام جفت‌به‌جفت بهتر است؟

</div>
