# 1. FastAPI

## 강의 소개

Part3에 오신 것을 환영합니다, 여러분!  

이전 Part에서는 머신 러닝 모델을 배포하는 프로세스와, 리눅스,클라우드 등을 배웠고, 이번 Part부터는 백엔드 프로그래밍을 다룰 수 있는 Fast API와, Docker, Logging, MLflow등을 학습하게 됩니다.  

이번 강의에서는 백엔드 프로그래밍에 사용되는 Fast API에 대해 다룰 예정입니다.

<br>

## 1.1 벡엔드 프로그래밍

### 1.1.1 Server 구성 Use Case

<br>

### 1.1.2 Server의 형태

- 모놀리식 아키텍처 (Monolithic Architecture)
  - 모두 하나에서 처리하는 경우
- 마이크로서비스 아키텍처 (MSA, Mircroservice Architecture)
  - 개별 서버로 구성

<br>

### 1.1.3 REST API

- 정보를 주고 받을 때 널리 사용되는 형식
- REST란 형식의 API
  - 각 요청이 어떤 동작이나 정보를 위한 것을 요청 모습 자체로 추론할 수 있음
  - 기본적인 데이터 처리 : 조회 작업, 새로 추가, 수정, 삭제
    - CRUD : Create, Read, Update, Delete

- REST: Representational State Transfer의 약자
  - Resource, Method, Representation of Resource로 구성
- 클라이언트
  - 요청을 하는 플랫폼
  - 브라우저 같은 웹일 수 있고, 앱일수도 있음
  - 우리가 Python을 사용해 요청하는 것도 클라이언트
- Resource
  - Unique한 ID를 가지는 리소스, URI
- Method
  - 서버에 요청을 보내기 위한 방식
  - GET, POST, PUT, PATCH, DELETE

<br>

### 1.1.4 URI, URL

- URL (Uniform Resource Locator)
  - 인터넷 상 자원의 위치
- URI (Uniform Resource Indentifier)
  - 인터넷 상의 자원을 식별하기 위한 문자열의 구성
  - URI는 URL을 포함 (URI가 더 포괄적인 개념)

<br>

### 1.1.5 HTTP Method의 종류

- GET : 정보를 요청하기 위해 사용(Read)
- POST : 정보를 입력하기 위해 사용(Create)
- PUT : 정보를 업데이트하기 위해 사용(Update)
- PATCH : 정보를 업데이트하기 위해 사용(Update)
- DELETE : 정보를 삭제하기 위해 사용(Delete)

- GET과 POST의 차이

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
<img src='https://drive.google.com/uc?id=1yixWoz1eoAyIVub2ui9O3DPNY87kPrkV' width=600/>

<br>

### 1.1.6 Header와 Body

<br>

### 1.1.7 Status Code

- 클라이언트 요청에 따라 서버가 어떻게 반응하는 지를 알려주는 code

<br>

### 1.1.8 동기(sync)와 비동기(async)

<br>

### 1.1.9 IP

- Internet Protocol
- 네트워크에 연결된 특정 PC의 주소를 나타내는 체계
- IPv4
  - 4덩이의 숫자로 구성된 IP 주소 체계
- 0.0.0.0, 255.255.255.255
  - broadcast address
  - 로컬 네트워크에 접속된 모든 장치와 소통하는 주소

<br>

### 1.1.10 Port

- PC에 접속할 수 있는 통로(채널)
- 22: SSH
- 80: HTTP
- 443: HTTPS

<br>

## 1.2 Fast API

### 1.2.1 FastAPI 소개

- 최근에 떠오르는 Python Web Framework

<br>

### 1.2.2 FastAPI 특징

- High Performance
- Easy
  - Flask와 비슷한 구조
- Productivity
  - Swagger 자동 생성
  - Pydantic을 이용한 Serialization

<br>

### 1.2.3 FastAPI vs Flask

장점

- Flask보다 Router 문법이 간결하다.
- 비동기 지원
- Built-in API Documentation (Swagger)
- Pydantic을 이용한 Serialization 및 Validation

아쉬운 점

- 아직까진 Flask의 유저가 더 많음
- ORM 등 Database와 관련된 라이브러리가 적음

<br>

### 1.2.4 프로젝트 구조

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
<img src='https://drive.google.com/uc?id=1yj_oOWe3XALeTGV6CmJVvL8js-naJUMd' width=300/>

- `app`
  - 프로젝트의 코드가 들어갈 모듈 설정
  - 다른 이름으로 지정할 수도 있음 (ex. 프로젝트 이름, src 등)
- `__main__.py`
  - 간단하게 애플리케이션을 실행할 수 있는 EntryPoint 역할
  - cf) EntryPoint: 프로그래밍 언어에서 최상위 코드가 실행되는 시작점 또는 프로그램 진입점
- `main.py`, `app.py`
  - FastAPI의 애플리케이션과 Router 설정
- `model.py`
  - ML Model에 대한 클래스와 함수 정의

- 하나의 파일에는 하나의 목적성에 맞는 함수들만 저장하는 것이 좋다.
  - `utils.py`에 몰아 넣는 것은 좋지 않다...

<br>

### 1.2.5 Poetry

- Dependency Resolver로 복잡한 의존성들의 버전 충돌을 방지
- Virtualenv를 생성해서 격리된 환경에서 빠르게 개발이 가능해짐
- 기존 파이썬 패키지 관리 도구에서 지원하지 않는 Build, Publish가 가능
- `pyproject.toml`을 기준으로 여러 툴들의 config를 명시적으로 관리
- 새로 만든 프로젝트라면 poetry를 사용해보고, virtualenv 등과 비교하는 것을 추천

<br>

#### 1.2.5.1 설치

- [공식 홈페이지 링크](https://python-poetry.org/docs/)
- Requirements
  - Python 2.7 or 3.5+
- MAC OSX / Linux:
  - `curl -sSL https://raw.githubusercontent.com/python-poetry/poetry/master/get-poetry.py | python -`
- Windows(Powershell)
  - `(Invoke-WebRequest -Uri https://raw.githubusercontent.com/python-poetry/poetry/master/get-poetry.py -UseBasicParsing).Content | python -`

<br>

#### 1.2.5.2 Poetry 프로젝트 생성

- Poetry 사용 흐름
  - 프로젝트 init
  - Poetry Shell 활성화
  - Poetry Install
  - Poetry Add

<br>

### 1.2.6 Swagger

- Swagger가 유용한 이유
  - 여러 사람들에게 Request 방법을 Swagger를 통해 전달할 수 있다.
  - REST API 설계 및 문서화할 때 사용
    - 다른 개발팀과 협업하는 경우
    - 구축된 프로젝트를 유지보수하는 경우

<br>

## 1.3 FastAPI 기본 지식

### 1.3.1 Path Parameter

- `/users/402`
- 서버에 402라는 값을 전달하고 변수로 사용

- 어떤 resource를 식별하고 싶은 경우 (하지만 kyle이라는 유저는 없음)
  - `/users/kyle`
  - 저 경로에 존재하는 내용이 없으므로 404 Error 발생

- Resource를 식별해야 하는 경우 -> Path Parameter가 더 적합

<br>

### 1.3.2 Query Parameter

- `/users?id=402`
- query string
- API 뒤에 입력 데이터를 함께 제공하는 방식으로 사용
- Query String은 Key, Value의 쌍으로 이루어지며 `&`로 연결해 여러 데이터를 넘길 수 있음

- 어떤 resource를 식별하고 싶은 경우 (하지만 kyle이라는 유저는 없음)
  - `/users/name=kyle`
  - 데이터가 없는 경우 빈 리스트가 나옴 -> 추가로 Error Handling 필요

- 정렬, 필터링을 해야 하는 경우 -> Query Parameter가 더 적합

<br>

### 1.3.3 Optional Parameter

- 특정 파라미터는 선택적으로 하고 싶은 경우

<br>

### 1.3.4 Request Body

- 클라이언트에서 API에 데이터를 보낼 때, Request Body를 사용함
- 클라이언트 => API : Request Body
- API의 Response => 클라이언트 : Response Body

- Request Body에 데이터가 항상 포함되어야 하는 것은 아님
- **Request Body에 데이터를 보내고 싶다면 POST Method를 사용**
  - (참고) GET Method는 URL, Request Header로 데이터 전달

- POST Method는 Request Body에 데이터를 넣어 보냄
- Body의 데이터를 설명하는 Content-Type이란 Header 필드가 존재하고, 어떤 데이터 타입인지 명시해야 함

- 대표적인 컨텐츠 타입
  - `application/x-www-form-urlencoded`
    - BODY에 Key, Value 사용
    - `&` 구분자 사용
  - `text/plain`
    - 단순 txt 파일
  - `multipartform-data`
    - 데이터를 바이너리 데이터로 전송

<br>

### 1.3.5 Response Body

- API의 Response => 클라이언트 : Response Body
- Decorator의 response_model 인자로 주입 가능

- 역할
  - Output Data를 해당 정의에 맞게 변형
  - 데이터 Validation
  - Response에 대한 Json Schema 추가
  - 자동으로 문서화

<br>

### 1.3.6 Form

- Form(입력) 형태로 데이터를 받고 싶은 경우
- Form을 사용하려면 `python-multipart`를 설치해야 함

```bash
pip install python-multipart
```

- 프론트도 간단히 만들기 위해 `Jinja2` 설치

```bash
pip install Jinja2
```

- Form 클래스를 사용하면 Request의 Form Data에서 값을 가져옴
- `From(...)`
  - Python ellipsis
  - Required(필수 요소)를 의미
- FastAPI 웹 서버를 실행한 후 Swagger로 이동하면 Required를 볼 수 있음

<br>

### 1.3.7 File

- File 업로드하고 싶은 경우
- File을 사용할 때도 `python-multipart`를 설치해야 함

<br>

## 1.4 Pydantic

### 1.4.1 Pydantic

- FastAPI에서 Class 사용할 때 보이던 Pydantic
- Data Validation / Settings Management 라이브러리
- Type Hint를 런타임에서 강제해 안전하게 데이터 핸들링

- 파이썬 기본 타입(String, Int 등) + List, Dict, Tuple에 대한 Validation 지원
- 기존 Validation 라이브러리보다 빠름 ([Benchmark](https://pydantic-docs.helpmanual.io/benchmarks/))
- Config를 효과적으로 관리하도록 도와줌
- 머신러닝 Feature Data Validation으로도 활용 가능

- Pydantic의 두 가지 기능 확인
  1. Validation
  2. Config 관리

<br>

### 1.4.2 Pydantic Validation

- **Machine Learning Model Input Validation**
- Online Serving에서 Input 데이터를 Validation하는 Case

<br>

#### 1.4.2.1 Validation Check Logic

- 조건 1: 올바른 url을 입력 받음 (url)
- 조건 2: 1-10 사이의 정수 입력 받음 (rate)
- 조건 3: 올바른 폴더 이름을 입력 받음(target_dir)

<br>

#### 1.4.2.2 사용할 수 있는 방법

1. 일반 Python Class를 활용한 Input Definition 및 Validation
2. Dataclass를(python 3.7 이상 필요) 활용한 Input Definition 및 Validation
3. Pydantic을 활용한 Input Definition 및 Validation

<br>

#### 1.4.2.3 Python Class 활용 Validation

- Python Class로 Input Definition 및 Validation => 의미 없는 코드가 많아짐
- 복잡한 검증 로직엔 Class Method가 복잡해지기 쉬움
- Exception Handling을 어떻게 할지 등 커스텀하게 제어할 수 있는 있지만 메인 로직(Input을 받아서 Inference를 수행하는)에 집중하기 어려워짐

<br>

#### 1.4.2.4 dataclass 활용 Validation

- dataclass 데코레이터 사용으로 `init` method를 따로 작성할 필요가 없어짐
- post init 메서드(`__post_init__()`) 같은 편의 매직 메서드 사용 가능
- 하지만 여전히 validate method를 따로 만들어야 함 (길어지는 검증 로직을 분리하기 위해)

- 인스턴스 생성 시점에서 Validation을 수행하기 쉬움
- 여전히 Validation 로직들을 직접 작성해야 함
- Validation 로직을 따로 작성하지 않으면, 런타임에서 type checking을 지원하지 않음

<br>

#### 1.4.2.5 Pydantic Validation

- 훨씬 간결해진 코드
- 주로 쓰이는 타입들(http url, db url, enum 등)에 대한 Validation이 만들어져 있음
- 런타임에서 Type Hint에 따라서 Validation Error 발생
- Custom Type에 대한 Validation도 쉽게 사용 가능
- [참고 링크](https://pydantic-docs.helpmanual.io/usage/types/)

- 어디서 에러가 발생했는 지 location, type, message 등을 알려줌

<br>

### 1.4.3 Pydantic Config

- Pydantic은 Config을 체계적으로 관리할 방법을 제공
- 기존에 다른 라이브러리들은 어떻게 Config를 설정하고 있을까?

- 애플리케이션은 종종 설정을 상수로 코드에 저장함
- 이것은 Twelve-Factor를 위반

- Twelve-Factor는 설정을 코드에서 엄격하게 분리하는 것을 요구함
- Twelve-Factor App은 설정을 환경 변수(envvars나 env라고도 불림)에 저장함
- 환경 변수는 코드 변경 없이 쉽게 배포 때마다 쉽게 변경할 수 있음

- The Twelve-Factor App이라는 SaaS(Software as a Service)를 만들기 위한 방법론을 정리한 규칙들에 따르면, 환경 설정은 애플리케이션 코드에서 분리되어 관리되어야 함

- 참고 글: [https://12factor.net/ko/config](https://12factor.net/ko/config)

<br>

#### 1.4.3.1 `.ini`, `.yaml` 파일 등으로 config 설정하기

- yaml로 환경 설정을 관리할 경우, 쉽게 환경을 설정할 수 있지만, 환경에 대한 설정을 코드 하드코딩하는 형태
- 때문에 변경 사항이 생길 때 유연하게 코드를 변경하기 어려움

<br>

#### 1.4.3.2 flask-style config.py

- Config 클래스에서 yaml, ini 파일을 불러와 python class 필드로 주입하는 과정을 구현
- Config를 상속한 클래스에서는 Config 클래스의 정보를 오버라이딩해서 사용
- 하지만 해당 파일의 데이터가 정상적인지 체크하거나(Validation) 또는 환경 변수로 부터 해당 필드를 오버라이딩(Overriding) 하려면 코드량이 늘어남

<br>

#### 1.4.3.3 pydantic base settings

- Validation처럼 Pydantic은 BaseSettings를 상속한 클래스에서 Type Hint로 주입된 설정 데이터를 검증할 수 있음
- Field 클래스의 env 인자로, 환경 변수로 부터 해당 필드를 오버라이딩 할 수 있음
- yaml, ini 파일들을 추가적으로 만들지 않고, .env 파일들을 환경별로 만들어 두거나, 실행 환경에서 유연하게 오버라이딩 할 수 있음

<br>

#### 1.4.3.4 3가지 방법 비교

- 위의 세 방법 모두 틀린 방법은 아님
- 실무에서는 무조건 pydantic을 활용하기 보다는, 각 팀에서 맞는 방법을 따라가는 것이 좋음
- 하지만 실무에서 여러 사람과 협업하는 환경에서 Human Error를 줄여주는 Pydantic의 기능들은 유용!

<br>

## 1.5 FastAPI 익숙해지기

### 1.5.1 Event Handler

- 이벤트가 발생했을 때, 그 처리를 담당하는 함수
- FastAPI에선 Application이 실행할 때, 종료될 때 특정 함수를 실행할 수 있음

- `@app.on_event(“startup”)`
- `@app.on_event(“shutdown”)`

- 예시
  - startup 할 때 머신러닝 모델 Load
  - shutdown 할 때 로그 저장

- `examples/11_event_hanlder.py`

<br>

### 1.5.2 API Router

- API Router는 더 큰 애플리케이션들에서 많이 사용되는 기능
- API Endpoint를 정의
- Python Subpackage
- APIRouter는 Mini FastAPI로 여러 API를 연결해서 활용

- 기존에 사용하던 `@app.get`, `@app.post`을 사용하지 않고, router 파일을 따로 설정하고 app에 import해서 사용

- `examples/12_api_router.py`
  - 실제 활용한다면 하나의 파일에 저장하지 않고 각각 저장 (`user.py`, `order.py`)

<br>

### 1.5.3 프로젝트 구조

```
.
└── app
   ├── __init__.py
   ├── main.py
   ├── dependencies.py
   └── routers
   │  ├── __init__.py
   │  ├── items.py
   │  └── users.py
   └── internal
      ├── __init__.py
      └── admin.py
```

&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;
<img src='https://drive.google.com/uc?id=1ylqDBFSlixXlr7CVnAkLP4Pc0GbOOhxn' width=800/>

```
.
└── app                   # 메인 App
   ├── __init__.py        # App, Python Package 생성을 위한 파일
   ├── main.py            # main Module. import app.main
   ├── dependencies.py    # 의존성 Module, import app.dependencies
   └── routers            # Sub FastAPI(Python Subpackage)
   │  ├── __init__.py     # Python Subpackage routers 생성
   │  ├── items.py        # items Submodule, import app.routers.items
   │  └── users.py        # users Submodule, import app.routers.users
   └── internal           # internal Python subpackage
      ├── __init__.py
      └── admin.py
```

<br>

### 1.5.4 Error Handling

- Error Handling은 웹 서버를 안정적으로 운영하기 위해 반드시 필요한 주제
- 서버에서 Error가 발생한 경우, 어떤 Error가 발생했는지 알아야 하고 요청한 클라이언트에 해당 정보를 전달해 대응할 수 있어야 함
- 서버 개발자는 모니터링 도구를 사용해 Error Log를 수집해야 함
- 발생하고 있는 오류를 빠르게 수정할 수 있도록 예외 처리를 잘 만들 필요가 있음

- `examples/13_exception_handling.py`

- `item_id`가 `5`일 경우 Internal Server Error 500 Return
- 이렇게 되면 클라이언트는 어떤 에러가 난 것인지 정보를 얻을 수 없고, 자세한 에러를 보려면 서버에 직접 접근해서 로그를 확인해야 함
- 에러 핸들링을 더 잘 하려면 에러 메시지와 에러의 이유 등을 클라이언트에 전달하도록 코드를 작성해야 함

- FastAPI의 `HTTPException`은 Error Response를 더 쉽게 보낼 수 있도록 하는 Class
- `HTTPException`을 이용해서 클라이언트에게 더 자세한 에러 메시지를 보내는 코드 작성

<br>

### 1.5.5 Background Task

- FastAPI는 Starlett이라는 비동기 프레임워크를 래핑해서 사용
- FastAPI의 기능 중 Background Tasks 기능은 오래 걸리는 작업들을 background에서 실행함

- Online Serving에서 CPU 사용이 많은 작업들을 Background Task로 사용하면,
- 클라이언트는 작업 완료를 기다리지 않고 즉시 Response를 받아볼 수 있음
  - ex) 특정 작업 후, 이메일 전송하는 Task 등

- `examples/14_background_tasks.py`

- Background Tasks를 사용하지 않은 작업들은 작업 시간 만큼 응답을 기다림
- Background Tasks를 사용한 작업들은 기다리지 않고 바로 응답을 주기 때문에 0초 소요
  - 실제 작업은 Background에서 실행됨

- 작업 결과물을 조회할 때는 Task를 어딘가에 저장해두고, GET 요청을 통해 Task가 완료됐는지 확인

<br>

## 1.6 FastAPI가 어렵다면

### 1.6.1 프로젝트 구조 - Cookiecutter

- 쿠키를 만들 때 사용하는 Cookiecutter
- 많은 사람들이 프로젝트 구조에 대한 고민이 많아 템플릿을 서로 공유

- [https://github.com/cookiecutter/cookiecutter](https://github.com/cookiecutter/cookiecutter)

- CLI 형태로 프로젝트 생성 과정을 도와줌
- 회사에서 공통의 프로젝트 구조가 필요하면 쿠키 커터로 설정
- 개인용 쿠키 커터 템플릿을 만드는 것도 좋은 방법

- Cookiecutter Data Science
  - [https://github.com/drivendata/cookiecutter-data-science](https://github.com/drivendata/cookiecutter-data-science)

- cookitcutter-fastapi
  - [https://github.com/arthurhenrique/cookiecutter-fastapi](https://github.com/arthurhenrique/cookiecutter-fastapi)

- 아예 처음 진행할 때는 일단 하나의 파일에 모두 코드 작성해서 FastAPI에 익숙해지고 그 이후에 다른 프로젝트 구조를 참고해서 코드 개선
- 클린 아키텍처 류의 책을 보면서 계속 구조 고민해보기

<br>

### 1.6.2 객체 지향

- 절차형 프로그래밍 vs 객체 지향 프로그래밍의 차이 이해해보기
- 객체 지향 프로그래밍은 코드의 중복을 최소화해서 재사용성을 증가시킴
- 복잡한 로직이 들어갈수록 점점 빛을 발휘함

- 현재 가지고 있는 코드를 Class로 변경해보기
- Pydantic Use Case 탐색하기

<br>

### 1.6.3 Try & Error

- 백엔드 프로그래밍이 처음이면 낯선 것이 당연
- 코드를 작성하고 => 실행하고 => 수정하는 Flow
- 조급해하지 않고 작은 규모의 프로젝트부터 하나씩 만들기

- 목표를 설정하고(무엇을 만들겠다) => 기능을 정의 => 하나씩 구현
- 막연히 FastAPI를 학습해야지보다는 프로젝트를 FastAPI 백엔드로 구현! 등으로 목표 설정