# L0_S1 — Development Environment & Tooling (Master)

**Date:** 2025-09-21

**What you'll learn in this notebook:**
- Python versions and environments: pyenv / venv / Conda
- Project structure & IDE setup
- Code quality: Black, Ruff, isort, mypy
- pre-commit hooks and CI-ready workflow

> این نوت‌بوک از ادغام چند منبع تهیه شده تا محتوای تکراری حذف و مسیر مطالعه یکپارچه شود.


<div dir="rtl" align="right">


# 🗺️ موقعیت ما در نقشهٔ راه (L0)

- [■] Python پایه برای AI/ML
- [■■] **L0-S1: Development Environment**  ← شما اینجایید
- [□] NumPy/Pandas/Scikit-learn مقدماتی (مرور سریع)
- [□] SciPy و Matplotlib/Seaborn
- [□] نخستین الگوریتم‌های ML (intuition)

نوار پیشرفت: ████████░░ 60%


</div>

<div dir="rtl" align="right">


# 📘 ادامهٔ L0-S1: محیط توسعه (Development Environment)
در این بخش، با مدیریت نسخه‌های پایتون، محیط‌های مجزا، مدیریت وابستگی‌ها، ابزارهای مدرن (Poetry/Conda)،
ساختار استاندارد پوشه‌های پروژه، و Git/Branching آشنا می‌شویم.

## 🎯 اهداف
- درک تفاوت `pyenv` و `venv` (#L0S1-1)
- مدیریت وابستگی‌ها با `pip` و `requirements.txt` (#L0S1-2)
- آشنایی با `Poetry` و زمان استفاده از آن (#L0S1-3)
- آشنایی با `Conda` برای پروژه‌های علمی/داده‌ای (#L0S1-4)
- طراحی ساختار پوشهٔ پروژه و فایل‌های کلیدی (#L0S1-5)
- مبانی Git و Branching برای کار تیمی (#L0S1-6)


</div>

<div dir="rtl" align="right">


## #L0S1-1 — مدیریت نسخهٔ Python: `pyenv` vs `venv`
- **`pyenv`**: چند **نسخهٔ پایتون** را روی یک سیستم نصب/مدیریت می‌کند. (مثلاً 3.8، 3.10، 3.12)
- **`venv`**: یک **محیط مجزا** از پکیج‌ها برای هر پروژه می‌سازد (بدون تغییر نسخهٔ Python).

### چرا هر دو مهم‌اند؟
- در تیم‌ها باید **همه** روی یک نسخهٔ یکسان Python کدنویسی کنند → `pyenv` به همسان‌سازی نسخه کمک می‌کند.
- هر پروژه وابستگی‌های متفاوت دارد → `venv` ایزوله‌سازی وابستگی‌ها را تضمین می‌کند.


</div>

In [None]:

# نصب نمونه‌ای با pyenv (در شِل سیستم، نه داخل Colab)
# پیش‌نیازها بستگی به سیستم‌عامل دارد.
# راهنمای عمومی:
# 1) نصب pyenv
# 2) نصب نسخهٔ Python
# 3) تنظیم نسخهٔ محلی پروژه

# نصب نسخهٔ Python:
# pyenv install 3.12.5

# تنظیم نسخهٔ محلی برای پروژه (داخل پوشهٔ پروژه):
# pyenv local 3.12.5

# ساخت محیط مجزا با venv (پس از فعال بودن نسخهٔ درست Python):
# python -m venv .venv

# فعال‌سازی محیط (Linux/macOS):
# source .venv/bin/activate
# غیرفعال‌سازی:
# deactivate

# فعال‌سازی محیط (Windows PowerShell):
# .venv\Scripts\Activate.ps1


<div dir="rtl" align="right">


## #L0S1-2 — مدیریت وابستگی‌ها با `pip` و ثبت آن‌ها
- نصب پکیج‌ها داخل محیط مجزا با `pip install ...`
- ثبت دقیق نسخه‌ها برای بازتولید محیط: `pip freeze > requirements.txt`
- بازنصب همان محیط در ماشین دیگر: `pip install -r requirements.txt`

**نکتهٔ مهم**: `requirements.txt` وضعیت «فعلی» محیط را پین می‌کند (نسخه‌ها دقیق‌اند).


</div>

In [None]:

# داخل محیط فعال پروژه:
# نصب:
# pip install numpy pandas scikit-learn scipy matplotlib seaborn

# ثبت نسخه‌های دقیق:
# pip freeze > requirements.txt

# بازتولید محیط روی ماشین دیگر:
# pip install -r requirements.txt


<div dir="rtl" align="right">


## #L0S1-3 — Poetry در برابر pip: کی و چرا؟
- **Poetry** رویکرد مدرن برای مدیریت وابستگی‌ها + ساخت پکیج است.
- فایل‌های کلیدی: `pyproject.toml` و `poetry.lock`
- مزایا: رزولوشن وابستگی دقیق، اسکریپت‌ها، انتشار پکیج، و مدیریت نسخه‌ها.
- اگر پروژهٔ شما **کد قابل‌انتشار** دارد یا همکاری چندنفره دارید، Poetry گزینهٔ خوبی است.


</div>

In [None]:

# نصب Poetry (مثال عمومی؛ دستور واقعی بسته به سیستم فرق دارد):
# curl -sSL https://install.python-poetry.org | python -

# ساخت پروژهٔ جدید:
# poetry new myproject
# cd myproject

# افزودن وابستگی:
# poetry add numpy pandas

# ایجاد شِل محیط ایزوله:
# poetry shell

# اجرای پایتون/اسکریپت داخل محیط Poetry:
# poetry run python -V


<div dir="rtl" align="right">


## #L0S1-4 — Conda: کی مناسب است؟
- برای پروژه‌های علمی/داده‌ای که به **باینری‌های از پیش‌ساخته** (BLAS, MKL, CUDA) نیاز دارند، `conda` بسیار کارآمد است.
- مدیریت محیط + پکیج‌های غیر Python (مثل C/C++ libs) را ساده می‌کند.
- اگر GPU/CUDA و کتابخانه‌های علمی سنگین می‌خواهید، `conda` معمولاً انتخاب راحت‌تری است.


</div>

In [None]:

# نمونه‌های conda (در شِل سیستم):
# conda create -n ai-l0 python=3.12
# conda activate ai-l0
# conda install numpy pandas scikit-learn scipy matplotlib seaborn


<div dir="rtl" align="right">


## #L0S1-5 — ساختار استاندارد پوشهٔ پروژه
پیشنهاد ساختار پوشه‌ها برای پروژه‌های داده/ML:

```
project-name/
├─ README.md
├─ pyproject.toml / requirements.txt
├─ .gitignore
├─ src/
│  └─ package_name/
│     ├─ __init__.py
│     ├─ data_io.py
│     ├─ features.py
│     └─ models.py
├─ notebooks/
│  └─ 01_exploration.ipynb
├─ tests/
│  └─ test_features.py
├─ data/
│  ├─ raw/      (فایل‌های خام - در git نریزید)
│  ├─ interim/  (میانی)
│  └─ processed/(تمیز/نهایی)
└─ scripts/
   └─ train.py
```

**نکته‌ها**
- داده‌های خام را در Git نریزید؛ آن‌ها را در `data/raw` نگه دارید و در `.gitignore` ثبت کنید.
- نوت‌بوک‌ها را در `notebooks/` نگه دارید، و کد اصلی را در `src/` تا تکرار نشود.


</div>

In [None]:

# نمونهٔ .gitignore مخصوص پروژه‌های داده/ML
# فایل: .gitignore

# Python
__pycache__/
*.py[cod]
*.pyo
*.pyd
*.so
*.egg-info/

# Virtual env
.venv/
env/
venv/

# Jupyter/Colab
.ipynb_checkpoints/
.notebooks_cache/

# Data
data/raw/
data/interim/
data/tmp/
*.csv
*.parquet
*.xlsx

# OS/IDE
.DS_Store
*.swp
.vscode/
.idea/


<div dir="rtl" align="right">


## #L0S1-6 — Git و همکاری تیمی
- هر تغییر منطقی → یک commit با **پیام واضح**.
- برای فیچرهای جدید از **branch** جداگانه استفاده کنید (مثلاً `feature/cleaning`).
- Pull Request برای مرور کد و بحث.
- قوانین سادهٔ نام‌گذاری: `feature/...`, `bugfix/...`, `hotfix/...`


</div>

In [None]:

# آغاز مخزن
# git init
# git add .
# git commit -m "init: scaffold project structure"

# ساخت branch جدید برای فیچر
# git checkout -b feature/data-loading
# ... تغییرات ...
# git add src/data_io.py
# git commit -m "feat(data): add CSV loader with schema validation"

# بازگشت به شاخهٔ اصلی و ادغام
# git checkout main
# git merge feature/data-loading

# ارسال به GitHub
# git remote add origin https://github.com/user/repo.git
# git push -u origin main


<div dir="rtl" align="right">


# 🧪 تمرین‌های L0-S1 (Lesson Only)
1) در یک پوشهٔ تست، با `pyenv` نسخهٔ Python دلخواه را نصب و `pyenv local` کنید. سپس با `python -m venv .venv` یک محیط بسازید و فعال کنید. بسته‌های `numpy, pandas, scikit-learn` را نصب و خروجی `pip freeze > requirements.txt` بگیرید.
2) همان پروژه را با **Poetry** بسازید: یک پکیج فرضی `ml_utils` ایجاد کنید، وابستگی‌های `numpy` و `pandas` را اضافه کنید و اسکریپتی برای چاپ نسخهٔ NumPy بنویسید (با `poetry run` اجرا کنید).
3) ساختار پوشه‌های پیشنهادی را پیاده کنید. برای `data/raw` یک فایل نمونهٔ CSV قرار دهید و مطمئن شوید که در `.gitignore` است.
4) یک مخزن Git بسازید، روی شاخهٔ `feature/project-scaffold` ساختار را اضافه کنید، commit بزنید و سپس به `main` ادغام کنید.


</div>

<div dir="rtl" align="right">


# ❓ سؤالات تشریحی (+ پاسخ پیشنهادی برای یادداشت‌برداری)
**س1. تفاوت `pyenv` و `venv` چیست و چرا معمولاً هر دو لازم‌اند؟**  
پاسخ پیشنهادی: `pyenv` نسخهٔ مفسر پایتون را در سطح سیستم مدیریت می‌کند، در حالی‌که `venv` برای هر پروژه یک محیط ایزوله از وابستگی‌ها می‌سازد. در کار تیمی نیاز است همه روی نسخهٔ یکسان Python باشند (کاربرد pyenv) و هر پروژه وابستگی‌های خودش را داشته باشد (کاربرد venv).

**س2. چه تفاوتی بین `requirements.txt` و `pyproject.toml` وجود دارد؟**  
پاسخ پیشنهادی: `requirements.txt` لیست **وضعیت فعلی** وابستگی‌ها با نسخه‌های پین‌شده است (مناسب بازتولید سریع). `pyproject.toml` فایل پیکربندی مدرن برای مدیریت وابستگی و ساخت پکیج است که توسط ابزارهایی مانند Poetry استفاده می‌شود و همراه با `poetry.lock` رزولوشن دقیق نسخه‌ها را تضمین می‌کند.

**س3. در چه پروژه‌هایی Conda انتخاب بهتری است؟**  
پاسخ پیشنهادی: زمانی که به باینری‌های از پیش‌ساخته (مانند BLAS/MKL/CUDA) یا کتابخانه‌های علمی سنگین نیاز داریم و سازگاری کامپایل دشوار است؛ مخصوصاً برای کار با GPU.

**س4. اصول طراحی ساختار پوشهٔ پروژهٔ داده/ML چیست و چرا دادهٔ خام را در Git قرار نمی‌دهیم؟**  
پاسخ پیشنهادی: جداسازی کد (`src/`)، نوت‌بوک‌ها (`notebooks/`)، تست‌ها (`tests/`) و داده‌ها (`data/`) مانع تداخل و تکرار می‌شود. دادهٔ خام حجیم و تکرارشونده است و تاریخچهٔ Git را بی‌دلیل بزرگ می‌کند؛ باید در `data/raw` بماند و در `.gitignore` باشد.

**س5. سه قاعدهٔ ساده برای تمیز نگه‌داشتن تاریخچهٔ Git را بنویسید.**  
پاسخ پیشنهادی: (۱) commitهای کوچک و معنادار با پیام واضح؛ (۲) شاخهٔ جدا برای هر فیچر/رفع‌باگ؛ (۳) Pull Request برای مرور کد پیش از ادغام.


</div>

<div dir="rtl" align="right">

# 📘 جلسه L0-S1 — بخش سوم: محیط توسعه (Development Environment)

در این بخش با اصول ساخت محیط کاری حرفه‌ای در پایتون آشنا می‌شویم: virtualenv، مدیریت پکیج‌ها، ابزارهای کیفیت کد، pre-commit hooks و ساختار پروژه.

</div>

<div dir="rtl" align="right">

## 1. محیط مجازی (Virtual Environment)

محیط مجازی باعث می‌شود هر پروژه کتابخانه‌های مخصوص به خودش را داشته باشد و پروژه‌ها به هم وابسته نشوند.

</div>

In [None]:
# ساخت محیط مجازی
python -m venv venv

# فعال‌سازی روی ویندوز (PowerShell)
.\venv\Scripts\Activate.ps1

# فعال‌سازی روی لینوکس/مک
source venv/bin/activate

# غیرفعال کردن
deactivate

<div dir="rtl" align="right">

## 2. مدیریت پکیج‌ها

چهار ابزار اصلی:

1. **pip**
2. **pip-tools**
3. **Poetry**
4. **uv**

</div>

In [None]:
# نصب پکیج با pip
pip install requests

# ذخیره نسخه‌ها در فایل requirements.txt
pip freeze > requirements.txt

In [None]:
# pip-tools
pip install pip-tools
pip-compile requirements.in

In [None]:
# Poetry
pip install poetry
poetry init
poetry add requests

<div dir="rtl" align="right">

## 3. ابزارهای کیفیت کد (Code Quality Tools)

- **Black** → auto-formatting  
- **Ruff** → linting  
- **isort** → مرتب‌سازی importها  
- **mypy** → static type checking  

</div>

In [None]:
pip install black ruff isort mypy
black src/
ruff src/
isort src/
mypy src/

<div dir="rtl" align="right">

## 4. Pre-commit Hooks

قبل از هر commit تست‌ها و formatterها اجرا می‌شوند. این کار تضمین می‌کند که کد کثیف وارد ریپو نمی‌شود.

</div>

In [None]:
pip install pre-commit
pre-commit install

In [None]:
# فایل .pre-commit-config.yaml نمونه

repos:
  - repo: https://github.com/psf/black
    rev: 23.7.0
    hooks:
      - id: black
  - repo: https://github.com/charliermarsh/ruff-pre-commit
    rev: v0.0.284
    hooks:
      - id: ruff

<div dir="rtl" align="right">

## 5. ساختار پروژه حرفه‌ای

یک پروژه استاندارد پایتونی معمولاً این ساختار را دارد:

</div>

In [None]:
project/
├── src/
│   └── package_name/
│       ├── __init__.py
│       ├── module1.py
│       └── module2.py
├── tests/
│   └── test_module1.py
├── requirements.in / pyproject.toml
├── .gitignore
├── README.md
└── .pre-commit-config.yaml

<div dir="rtl" align="right">

## 📝 تمرین‌ها

1. یک محیط مجازی بساز و یک پکیج (مثلاً `requests`) نصب کن.  
2. فایل `requirements.txt` تولید کن.  
3. ابزار Black و Ruff را نصب کن و روی یک فایل ساده اجرا کن.  
4. یک ساختار پروژه ساده شبیه نمونه بالا درست کن.  

</div>

<div dir="rtl" align="right">

## ❓ سؤالات تشریحی

- چرا virtual environment مهم‌تر از نصب global است؟  
- تفاوت Poetry با pip چیست و در چه شرایطی یکی بر دیگری برتری دارد؟  

</div>