# Session 5: 모델 배포 - Vertex AI Endpoint 생성

### ■ Session Objective
-   Vertex AI Model Registry에 등록된 `loan-approval-model`을 **Vertex AI Endpoint**에 배포(Deploy)합니다.
-   이 과정을 통해, 외부에서 실시간 추론(Real-time Inference) 요청을 처리할 수 있는 **REST API 서비스**를 생성합니다.

### ■ Prerequisite
-   **Session 4 완료:** Vertex AI Model Registry에 `loan-approval-model` (v1)이 성공적으로 등록되어 있어야 합니다.

---

### ■ Key Concepts

![Session 5 API Endpoint](./images/session5-api_flow.png)

1.  **Vertex AI Endpoint (엔드포인트)**
    -   하나 이상의 배포된 모델에 대한 **서비스 진입점**입니다.
    -   모델이 배포되면, 이 엔드포인트는 외부 애플리케이션이 예측 요청을 보낼 수 있는 고유한 **API URL**을 제공합니다.

2.  **배포 (Deployment)**
    -   Model Registry에 등록된 모델(자산)을 엔드포인트에 **연결**하고, 해당 모델을 실행할 **물리적인 컴퓨팅 리소스(서버)**를 할당하는 프로세스입니다.

3.  **머신 유형 (Machine Type)**
    -   모델을 서빙할 서버의 사양(vCPU, RAM)입니다. (`n1-standard-2` 등)
    -   선택한 사양에 따라 예측 성능과 **비용**이 결정됩니다.

---

### 🚨 (매우 중요) 비용 경고 (Cost Warning)

-   본 실습에서 **"배포" 버튼을 클릭하는 순간부터** Vertex AI는 엔드포인트를 위해 1대 이상의 가상 머신(서버)을 24시간 할당합니다.
-   즉, **사용 여부와 관계없이 실시간으로 비용이 청구됩니다.**
-   **Session 6**에서 테스트를 완료한 직후, **반드시 이 엔드포인트를 '배포 취소(Undeploy)'**하여 비용 발생을 중단해야 합니다.

---

### ■ [실습] Endpoint 배포 절차 (GCP Console UI)

1.  **Model Registry 메뉴 이동**
    -   Vertex AI 대시보드 왼쪽 메뉴에서 **모델 (Models)**을 클릭합니다.
    -   등록된 **`loan-approval-model`**을 클릭하여 상세 정보 페이지로 이동합니다.

2.  **배포 시작**
    -   **'버전 1'** 탭이 선택된 것을 확인하고, 페이지 상단의 **`배포 및 테스트`** 버튼을 클릭합니다.
    -   **엔드포인트에 배포** 클릭합니다.

3.  **엔드포인트 정의 (Define endpoint)**
    -   **새 엔드포인트 만들기**를 선택합니다.
    -   **엔드포인트 이름:** `loan-approval-service`
    -   **리전:** `asia-northeast3 (Seoul)`
    -   `계속` 버튼을 클릭합니다.

4.  **모델 설정 (Model settings)**
    -   **모델:** `loan-approval-model - 버전 1`이 선택되었는지 확인합니다.
    -   **트래픽 분할:** `100` % (기본값)
    -   **머신 유형:** 드롭다운 메뉴에서 `n1-standard-2` (vCPU 2개, 7.5GB RAM)를 선택합니다.
    -   **최소 노드 수:** `1`
    -   **최대 노드 수:** `1` (테스트 목적이므로 1로 고정하여 비용을 최소화합니다.)
    -   `계속` 버튼을 클릭합니다.

5.  **모델 모니터링 (Model Monitoring)**
    -   *이 실습에서는 설정하지 않습니다.*
    -   **`배포`** 버튼을 클릭하여 최종 배포를 시작합니다.

---

### ■ [확인] 배포 완료 대기 (10-15분 소요)

1.  **엔드포인트 메뉴 이동**
    -   Vertex AI 왼쪽 메뉴에서 **엔드포인트 (Endpoints)**를 클릭합니다.
    -   방금 생성한 **`loan-approval-service`**가 목록에 나타나며, '상태'가 '만드는 중...' (회전 아이콘)으로 표시됩니다.

2.  **배포 대기 (Wait for Deployment)**
    -   Vertex AI가 백그라운드에서 서버(VM)를 프로비저닝하고 모델을 설치하는 중입니다.
    -   이 과정은 **약 10분에서 15분 정도 소요**됩니다.
    -   (이 대기 시간 동안 다음 세션(Session 6)의 API 호출 코드를 미리 리뷰하고 설명할 수 있습니다.)

3.  **최종 확인**
    -   엔드포인트 상태가 초록색 체크 아이콘과 함께 **'활성'**으로 변경되면, 배포가 성공적으로 완료된 것입니다.
    -   엔드포인트 이름을 클릭하여 세부 정보 페이지로 이동하면, API 호출에 필요한 **'엔드포인트 ID'** (긴 숫자)를 확인할 수 있습니다.

### ■ Session 5 완료
-   축하합니다! 여러분의 AI 모델이 이제 GCP 클라우드 상에서 24시간 작동하는 **라이브 API 서비스**가 되었습니다.


### Reference
* https://blog.naver.com/ghdalswl77/222401162545