# HTTP 통신 개요

## #01. 준비과정

### [1] 패키지 참조

`requests` 패키지 설치가 필요하다.

In [30]:
import requests

### [2] 접속할 데이터의 URL

In [31]:
url = "https://data.hossam.kr/py/sample.txt"

## #02. 데이터 요청하기

### [1] 세션 생성

| `세션`: 통신에서 말하는 하나의 접속 단위 혹은 접속을 수행하는 객체

In [32]:
# 접속 객체 생성
session = requests.Session()

### [2] 세션에 클라이언트 정보 주입

일부 웹 시스템은 정상적인 웹 브라우저의 접속이 아닌경우 응답을 거부하도록 구현되어 있다.

In [33]:
session.headers.update({
    "Referer": "",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
})

### [3] 데이터 가져오기

#### HTTP 상태값

웹 사이트 도메인 자체가 잘못된 경우는 접속 자체가 불가능하기 때문에 python단에서 예외가 발생한다. 이 경우 예외처리 구문으로 대응할 수 있다.

웹 사이트 도메인은 정상이지만 그 사이트 안에서 존재하지 않는 페이지에 접근할 경우 예외가 발생하지 않는다.

이 때는 웹 사이트에서 반환하는 결과값(`r.status_code`)로 접속의 성공/실패 여부를 판별해야 하는데 이를 HTTP 상태값이라고 한다.

| 상태값 | 설명 |
|---|---|
| 200 | OK |
| 400 | 잘못된 요청 (URL 형식 에러) |
| 401 | 권한 없음 |
| 403 | 서버가 요청 거부 |
| 404 | 페이지를 찾을 수 없음 |
| 500 | 내부 서버 오류 (접속 대상 시스템의 에러) |
| 501 | 구현되지 않음 |

In [34]:
try:
    r = session.get(url)
    
    if r.status_code != 200:
        msg = "[%d Error] %s 에러가 발생함" % (r.status_code, r.reason)
        raise Exception(msg)
except Exception as e:
    print("접속에 실패했습니다.")
    print(e)

### [4] 수신된 응답 결과 확인

In [35]:
r.encoding = "utf-8"
print(type(r.text))
print(r.text)

<class 'str'>
안녕하세요.

이 파일은 HTTP Client 기능을 구현한 후 결과를 확인하기 위한 샘플 파일입니다.

