# temp.ipynb — Tổng hợp backend/pipeline (src/)

Notebook này **tự động nạp và hiển thị toàn bộ mã nguồn trong thư mục `src/`** (đúng thứ tự pipeline) để bạn xem/báo cáo.

- Không bao gồm `web/` theo yêu cầu.
- Khi bạn chạy notebook, nó sẽ đọc trực tiếp các file `.py` hiện có trong repo, nên nội dung luôn **đúng và đầy đủ** với codebase.


## 0) Setup
Chạy cell này trước để đảm bảo import được `src.*`.


In [None]:
import os, sys
ROOT = os.path.abspath(os.getcwd())
if ROOT not in sys.path:
    sys.path.insert(0, ROOT)
print('ROOT=', ROOT)
print('sys.path[0]=', sys.path[0])


## 1) Hiển thị toàn bộ file trong `src/` theo trình tự pipeline
Thứ tự đề xuất:
1. `config.py`
2. `preprocessing.py`
3. `feature_engineering.py`
4. `diagnostics.py`
5. `eda.py`
6. `model_*.py` (4 thành viên) + `model_phat.py` (legacy)
7. `evaluation.py`
8. `main.py` (entry train)
9. `app.py` (FastAPI)


In [None]:
from pathlib import Path
SRC = Path('src')
order = [
    'config.py',
    'preprocessing.py',
    'feature_engineering.py',
    'diagnostics.py',
    'eda.py',
    'model_doananhvu.py',
    'model_nguyenhuutuanphat.py',
    'model_lengoctien.py',
    'model_phantrantuonvy.py',
    'model_phat.py',
    'evaluation.py',
    'main.py',
    'app.py',
    '__init__.py',
]
missing = [p for p in order if not (SRC / p).exists()]
print('Missing:', missing)
print('Total files listed:', len(order))


In [None]:
def show_file(rel: str):
    p = SRC / rel
    print('\n' + '='*100)
    print(f'FILE: {p}')
    print('='*100)
    txt = p.read_text(encoding='utf-8')
    print(txt)

for rel in order:
    if (SRC / rel).exists():
        show_file(rel)


## 2) Chạy pipeline train (tương đương `python -m src.main`)
Bạn có thể chạy trực tiếp trong notebook bằng cách import và gọi `src.main.run()`.

Lưu ý: chạy cell này sẽ tốn thời gian nếu train đủ và/hoặc bật TensorFlow models.


In [None]:
# import os
# os.environ['TRAIN_VERBOSE'] = '1'
# os.environ['GRIDSEARCH_CV_SPLITS'] = '2'
# os.environ['RUN_TF_MODELS'] = '0'
#
# from src.main import run
# run()


## 3) Chạy API (FastAPI)
Notebook không nên tự start server, nhưng bạn có thể chạy ngoài terminal:

```bash
uvicorn src.app:app --reload
```
