
<div dir="rtl" align="right">


## 🟩 بخش اول: آشنایی با Indexing و Slicing در NumPy

در این جلسه با موضوعات زیر آشنا شدیم:
- ساخت ماسک بولی با عملگرها و `ufunc`ها
- فیلتر کردن آرایه‌ها و DataFrameها
- شرط‌گذاری ترکیبی (AND / OR)
- تفاوت روش‌های `df[...]`، `np.greater`، `np.mod` و غیره
- مقدماتی از `broadcasting` شرطی


</div>



🧭 موقعیت در نقشه مسیر:
```
Level 0 → جلسه 3 از 4
├── L0_1: NumPy Basics & Broadcasting ✅
├── L0_2: Reshape, Mean/Std, View vs Copy ✅
➡️ L0_3: Indexing, Boolean Masking & Filtering 🔥
├── L0_4: ترکیب ابزارها و پروژه مینی آنالیز 🔜
```

<div dir="rtl" align="right">

در NumPy، تو می‌تونی با استفاده از اندیس‌ها یا بازه‌ها (slicing) بخش‌هایی از آرایه‌ات رو جدا کنی.

</div>

<div dir="rtl" align="right">

## 🟩 بخش اول: Indexing و Slicing در NumPy

</div>


In [None]:
import numpy as np

a = np.array([[10, 20, 30],
              [40, 50, 60],
              [70, 80, 90]])

print(a[0, 1])       # مقدار سطر اول، ستون دوم → 20
print(a[1])          # کل سطر دوم → [40 50 60]
print(a[:, 1])       # تمام سطرها، ستون دوم → [20 50 80]
print(a[1:, 1:])     # از سطر دوم به بعد، از ستون دوم به بعد

<div dir="rtl" align="right">

🔸 مفهوم Slicing:

</div>

In [None]:
arr = np.arange(10)
print(arr[1:7:2])  # [1 3 5]
print(arr[::-1])   # برعکس کردن آرایه


<div dir="rtl" align="right">

🧠 نکته مهم: تفاوت لیست و NumPy در استفاده از گام منفی در Slicing

</div>


In [None]:
lst = [0, 1, 2, 3, 4]
print(lst[3:1:-1])  # [3, 2]
print(lst[1:3:-1])  # []

a = np.array([[0,1,2],[3,4,5],[6,7,8]])
print(a[:, 2:0:-1])  # [[2 1]
                     #  [5 4]
                     #  [8 7]]
print(a[:, 0:2:-1])  # []

<div dir="rtl" align="right">

## 🟩 بخش دوم: ماسک بولی (Boolean Masking) و فیلتر کردن در NumPy

ماسک بولی یعنی ایجاد یک آرایه‌ی True/False که می‌تونه برای فیلتر کردن مقادیر استفاده بشه.

</div>


In [None]:
a = np.array([10, 20, 30, 40, 50])
mask = a > 30
print(mask)      # [False False False  True  True]
print(a[mask])   # [40 50]
print(a[a > 30]) # روش مستقیم

<div dir="rtl" align="right">

🔹 شرط ترکیبی در NumPy (AND, OR, NOT)

</div>


<div dir="rtl" align="right">
### 🧠 نکته مهم در شرط‌ها:

برای استفاده از چند شرط، باید از &, |, ~ به‌جای and, or, not استفاده کنی:
</div>

In [None]:
a = np.array([10, 20, 30, 40, 50])

print(a[(a > 20) & (a < 50)])   # [30 40]
print(a[(a < 20) | (a > 40)])   # [10 50]
print(a[~(a > 30)])             # [10 20 30]


<div dir="rtl" align="right">

## 🟩 بخش سوم: ماسک بولی در آرایه‌های ۲بعدی

</div>


In [None]:
m = np.array([[1, 2],
              [3, 4],
              [5, 6]])

print(m[m[:, 0] > 2])  # فقط سطرهایی که مقدار ستون اول > 2


<div dir="rtl" align="right">

## 🟦 بخش چهارم: فیلتر کردن در Pandas

</div>


In [None]:
import pandas as pd

df = pd.DataFrame({
    'name': ['ali', 'sara', 'amir', 'niloofar'],
    'age': [25, 32, 18, 45]
})

filtered = df[df['age'] > 30]
print(filtered)

# شرط ترکیبی:
print(df[(df['age'] > 20) & (df['name'].str.startswith('a'))])


<div dir="rtl" align="right">

🔹 شرط روی ستون‌ها با iloc:

</div>


In [None]:
print(df.iloc[:, 1] > 30)           # ستون دوم (age)
print(df[df.iloc[:, 1] > 30])       # فقط ردیف‌هایی که age > 30

<div dir="rtl" align="right">
✅ تمرین 1:
یک آرایه‌ی 1 بعدی با 20 عدد صحیح تصادفی بین 1 تا 100 تولید کن.
هم با NumPy و هم با Pandas، اعداد بزرگتر از 50 را استخراج کن.
</div>

In [None]:
# NumPy
a = np.random.randint(1, 101, size=20)
filtered = a[a > 50]
print("Original:", a)
print("Filtered (>50):", filtered)

In [None]:
# Pandas
df = pd.DataFrame({'nums': a})
filtered_df = df[df['nums'] > 50]
print(filtered_df)

In [None]:

# Version 2

a = np.array([random.randint(0,100) for i in range(20)])
print(a)
print(a[a>50])
print(a[np.greater(a,50)])

<div dir="rtl" align="right">
✅ تمرین 2:
یک آرایه‌ی 2 بعدی با ابعاد (5×4) بساز که شامل اعداد تصادفی بین 10 تا 99 باشد.
ردیف‌هایی را فیلتر کن که میانگین ستون اولشان از 50 بیشتر باشد.
</div>

In [None]:
# NumPy
m = np.random.randint(10, 100, size=(5,4))
mask = m[:,0] > 50
filtered_rows = m[mask]
print("Original matrix:\n", m)
print("Filtered rows (col[0] > 50):\n", filtered_rows)

In [None]:
# Pandas
df = pd.DataFrame(m, columns=['A', 'B', 'C', 'D'])
filtered_df = df[df['A'] > 50]
print(filtered_df)

In [None]:

# Version 2

a = np.array([random.randint(10, 100) for _ in range(20)]).reshape(4,5)
print(a)
print(a[a[:,0]>50])
print(a[np.greater(a[:,0],50)])

<div dir="rtl" align="right">
✅ تمرین 3:
یک DataFrame با 6 سطر و 3 ستون بساز که شامل نام، سن، و نمره باشد.

همه افرادی که سن‌شان کمتر از 30 و نمره‌شان بالای 17 است را فیلتر کن
</div>

In [None]:
data = {
    'name': ['Ali', 'Sara', 'Niloofar', 'Reza', 'Mehdi', 'Tara'],
    'age': [28, 35, 22, 19, 31, 25],
    'score': [18.5, 14.0, 19.0, 17.5, 12.5, 20.0]
}
df = pd.DataFrame(data)
filtered = df[(df['age'] < 30) & (df['score'] > 17)]
print(filtered)

In [None]:

# Version 2

df = pd.DataFrame({
    'name':['iman', 'sara', 'hamid', 'sahar', 'kosar', 'asieh'],
    'age': [random.randint(18, 100) for _ in range(6)],
    'vote': [random.randint(0, 21) for _ in range(6)]
})
print(df)
print(df[(df['age'] < 30) & (df['vote'] > 17)])
print(df[(np.less(df['age'],30) & np.greater(df['vote'], 17))])


<div dir="rtl" align="right">
✅ تمرین 4:
با استفاده از NumPy، یک ماسک بولی بساز که مشخص کند کدام عناصر آرایه زیر زوج هستند.
در ادامه، همان را در Pandas انجام بده و فقط ردیف‌هایی را نگه‌دار که مقدار ستون دومشان زوج است.
</div>

In [None]:
# NumPy
arr = np.random.randint(1, 50, size=(5, 3))
even_mask = arr % 2 == 0
print("Original array:\n", arr)
print("Even mask:\n", even_mask)

In [None]:
# Pandas
df = pd.DataFrame(arr, columns=['X', 'Y', 'Z'])
filtered_df = df[df['Y'] % 2 == 0]
print(filtered_df)

In [None]:

# Version 2

a = np.random.randint(1,51,size=(5,3))
print(a)
msk_1 = a%2==0
msk_2 = np.equal(np.mod(a,2),0)
print(a[msk_1])
print(a[msk_2])
df = pd.DataFrame(a, columns=("a","b","c"))
print(df)
print(df[df.iloc[:,1]%2 ==0])
print(df[np.equal(np.mod(df.loc[:,"b"], 2),0)])

<div dir="rtl" align="right">
✅ تمرین 5 (ترکیبی و کمی دشوارتر):
یک DataFrame شامل اطلاعات زیر بساز:

ستون ۱: امتیاز تست اول

ستون ۲: امتیاز تست دوم

ستون ۳: نام فرد

سپس همه افرادی را پیدا کن که:

نمره تست اولشان بین 14 و 18 باشد یا

نمره تست دومشان کمتر از 10 باشد
نتایج را هم با NumPy (از روی آرایه‌ی اصلی) و هم با Pandas (DataFrame) فیلتر کن.
</div>

In [None]:
# NumPy
scores = np.random.randint(0, 21, size=(6,2))
names = np.array(['Ali', 'Sara', 'Niloofar', 'Reza', 'Mina', 'Kian'])

mask = (scores[:,0] >= 14) & (scores[:,0] <= 18) | (scores[:,1] < 10)
filtered_names = names[mask]
filtered_scores = scores[mask]

print("Names:", names)
print("Scores:\n", scores)
print("Filtered:\n", np.column_stack((filtered_names, filtered_scores)))

In [None]:
# Pandas
df = pd.DataFrame({
    'name': names,
    'test1': scores[:,0],
    'test2': scores[:,1]
})

filtered = df[((df['test1'] >= 14) & (df['test1'] <= 18)) | (df['test2'] < 10)]
print(filtered)

In [None]:

# Version 2

df = pd.DataFrame({
    'test_A':[random.randint(0, 20) for _ in range(6)],
    'test_B': [random.randint(0, 20) for _ in range(6)],
    'name': ['iman', 'sara', 'hamid', 'sahar', 'kosar', 'asieh']
})
print(df)
print(df[((df['test_A'] >= 14) & (df['test_A'] <= 18)) | (df['test_B'] < 10)])
print(df[((np.less_equal(df['test_A'], 18)) & (np.greater_equal(df['test_A'], 14))) | (np.less(df['test_B'], 10))])


<div dir="rtl" align="right">

## چند مثال دیگر

</div>

In [None]:

import numpy as np
a = np.array([1, 2, 3, 4, 5, 6])
print(a[a > 3])                 # شرط ساده با عملگر
print(a[np.greater(a, 3)])      # همان شرط با ufunc


In [None]:

a = np.random.randint(10, 100, size=(4, 5))
print(a)
print(a[a[:, 0] > 50])  # فیلتر سطرها بر اساس ستون اول


In [None]:

import pandas as pd
df = pd.DataFrame({
    'name': ['iman', 'sara', 'hamid', 'sahar', 'kosar', 'asieh'],
    'age': [23, 45, 28, 18, 33, 22],
    'vote': [10, 19, 8, 20, 17, 6]
})
print(df[df['age'] < 30])
print(df[(df['age'] < 30) & (df['vote'] > 17)])


In [None]:

# ماسک برای زوج‌ها
a = np.random.randint(1, 51, size=(5, 3))
mask = a % 2 == 0
print(a)
print(a[mask])


In [None]:

# شرط ترکیبی پیچیده
df = pd.DataFrame({
    'test_A': [14, 16, 10, 8, 19, 20],
    'test_B': [11, 5, 9, 3, 18, 2],
    'name': ['iman', 'sara', 'hamid', 'sahar', 'kosar', 'asieh']
})
print(df[((df['test_A'] >= 14) & (df['test_A'] <= 18)) | (df['test_B'] < 10)])



<div dir="rtl" align="right">

## 🧠 تمرین‌ها




</div>


<div dir="rtl" align="right">

1. آرایه‌ای با 20 عدد تصادفی بین 0 تا 100 بساز. تمام مقادیر بزرگ‌تر از ۵۰ را استخراج کن.


</div>

<div dir="rtl" align="right">

2. یک آرایه‌ی ۲بعدی (4×5) با اعداد تصادفی بساز. سطرهایی را استخراج کن که مقدار ستون اول آن‌ها بیش از ۵۰ است.

</div>

<div dir="rtl" align="right">

3. DataFrame بساز با ستون‌های `age` و `vote`. ردیف‌هایی را پیدا کن که `age < 30` و `vote > 17`.

</div>

<div dir="rtl" align="right">

4. در یک آرایه 5×3 بررسی کن کدام عناصر زوج هستند و آن‌ها را چاپ کن. سپس DataFrame بساز و فقط ردیف‌هایی که ستون دوم زوج است را نگه دار.

</div>

<div dir="rtl" align="right">

5. DataFrame بساز و ردیف‌هایی را پیدا کن که یا `test_A` بین 14 تا 18 باشد یا `test_B` کمتر از 10 باشد.
</div>


<div dir="rtl" align="right">

## 🧠 تحلیل و نسخه‌ی حرفه‌ای‌تر تمرین‌ها

- در اکثر موارد کدهای ایمان کاملاً درست و خوانا بودند 👏  
- در پروژه‌های بزرگ، استفاده از `ufunc`ها برای عملکرد بهتر و خوانایی در شرایط پیچیده توصیه می‌شود.
- در `Pandas` معمولاً استفاده از عملگرهای `&`, `|` همراه با پرانتز بهتر خوانده می‌شود.
- استفاده از `iloc`, `loc` را در جلسات بعدی دقیق بررسی خواهیم کرد.

</div>
