# http.client 모듈
## get, post 이외의 방식으로 요청을 보내거나 요청 헤더와 바디 사이에 타이머를 두어 시간을 지연시키는 등 urllib.request 모듈로는 쉽게 처리할 수 없는 경우 혹은 HTTP 프로토콜 요청에 대한 저수준의 더 세밀한 기능이 필요할 때는 http.client 모듈을 사용함


### http.client 모듈 사용시 코딩 순서
### 1. 연결 객체 생성 conn = http.client.HTTPConnection('www.python.org')
### 2. 요청을 보냄 conn.request('GET', '/index.html')
### 3. 응답 객체 생성 response = conn.getresponse()
### 4. 응답 데이터 읽음 data = response.read()
### 5. 연결을 닫음 conn.close()


In [10]:
# GET 메소드로 요청 보내는 예제

from http.client import HTTPConnection

host = 'www.example.com'
conn = HTTPConnection(host) # 연결 객체 생성
conn.request('GET', '/') # 요청 보냄
r1 = conn.getresponse() # 응답 객체 생성
print(r1.status, r1.reason) # 응답 상태, 응답 이유? 출력 

200 OK


In [15]:
data1 = r1.read() # 응답 데이터 읽음
# 일부만 읽으면 request() 요청을 할수 없다?
data1 = r1.read(100)
conn.close

<bound method HTTPConnection.close of <http.client.HTTPConnection object at 0x02B03930>>

In [16]:
conn.request('GET', '/')
r2 = conn.getresponse()
print(r2.status, r2.reason)

200 OK


In [18]:
data2 = r2.read()
print(data2.decode())
conn.close




<bound method HTTPConnection.close of <http.client.HTTPConnection object at 0x02B03930>>

In [23]:
#  HEAD 메소드로 요청 보내는 예제
from http.client import HTTPConnection

conn = HTTPConnection('www.example.com')
conn.request('HEAD', '/')
resp = conn.getresponse()
print(resp.status, resp.reason)
data = resp.read()
print(len(data))
print(data == b'')
conn.close

200 OK
0
True


<bound method HTTPConnection.close of <http.client.HTTPConnection object at 0x059A4B70>>

In [27]:
# Post 메소드로  요청을 보내는 예제

from urllib.parse import urlencode

host = 'localhost:8000'
 # post 요청 보낼 파라미터에 대해 url 인코딩
params = urlencode({
    'language' : 'python',
    'name' : '김석훈',
    'email' : 'shkim@naver.com'
})
# post 요청으로 보낼 헤더를 사전 타입으로 지정
headers = {
    'Content-Type' : 'application/x-www-form-urlencoded',
    'Accept' : 'text/plain',
}

conn = HTTPConnection(host)
conn.request('POST', '/')

resp = conn.getresponse() # 응답 객체 생성
print(resp.status, resp.reason) 
data = resp.read() # 응답 데이터 읽음
print(data.decode('utf-8'))
conn.close()




200 OK
<!DOCTYPE html>
<html lang="ko">



<head>

    <meta charset="utf-8">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">

    <title>ch2-test-server</title>

    <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.6/css/bootstrap.min.css">
    <link rel="stylesheet" href="https://maxcdn.bootstrapcdn.com/bootstrap/3.3.6/css/bootstrap-theme.min.css">

    <!-- my css -->
    <link rel="shortcut icon" href="/static/img/favicon.ico">

    <style type="text/css">
    .homewindow {
        background-size: 100%;
        height: 500px;
        border-top: 10px solid #ccc;
        border-bottom: 10px solid #ccc;
        padding: 20px 100px;
    }
    .title {
        color: #c80;
        font-weight: bold;
    }
    .homewindow ul li {
        font-weight: bold;
        line-height: 30px;
    }
    </style>

</head>

<body style="padding-top:90px;">

    <div class="homewindow">
     

## http.client모듈 예제
### 특정 웹 사이트에서 이미지만을 검색하여 그 이미지들을 다운로드하는 코드


In [30]:
import os
from http.client import HTTPConnection
from urllib.parse import urljoin, urlunparse # urlunparse : urlparse 로 분해한 url을 다시 합침
                                                                    # urljoin : 기본 url www.naver.com/뒤에 잡다한게 ...
from urllib.request import urlretrieve # url의 이미지 다운받을 떄 쓰는 함수
from html.parser import HTMLParser

class ImageParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        if tag != 'img': 
            return
        if not hasattr(self, 'result'):
            self.result = []
        for name, value in attrs:
            if name == 'src':
                self.result.append(value)
    
    
def download_image(url, data):
    if not os.path.exists('DOWNLOAD'): # 다운 받은 이미지 저장 경로 생성 
        # DOWNLOAD 경로가 없으면
        os.makedirs('DOWNLOAD')  # 디렉토리가 없으면 만들어줌
    parser = ImageParser()
    parser.feed(data)
    dataSet = set(x for x in parser.result)
    
    for x in sorted(dataSet): # dataSet으로 모은 파싱 결과를 정렬한 후에 하나씩 처리
        # 다운로드 하기 위해 URL과 타킷 파일명을 지정
        # 소스 URL을 지정할 떄 urljoin() 함수를 사용
        # urljoin() 함수는 baseURL 과 파일명을 함쳐서 완전한  URL 리턴하는 함수
        imageUrl = urljoin(url, x) # 10
        basename = os.path.basename(imageUrl)
        targetFile = os.path.join('DOWNLOAD', basename)
        
        print("Downloading...", imageUrl)
        # 이미지 파일을 다운로드 하기 위해 urlretrieve() 함수를 사용
        # urlretrieve() 함수는 src 로부터 파일을 가져와서 targetFile 파일로 생성
        urlretrieve(imageUrl, targetFile)# 11

def main():
    host = 'www.google.co.kr'
    
    conn = HTTPConnection(host)
    conn.request('GET', '')
    resp = conn.getresponse()
    
    charset = resp.msg.get_param('charset')
    data = resp.read().decode(charset)
    conn.close()
    
    print('\n>>>>> Download Image from', host)
    url = urlunparse(('http', host,'', '', '', ''))
    download_image(url, data)
    
if __name__ == '__main__':
    main()
    
    
        
    
    
    
    
            
            
            
        
 


>>>>> Download Image from www.google.co.kr
Downloading... http://www.google.co.kr/images/branding/googlelogo/1x/googlelogo_white_background_color_272x92dp.png
Downloading... http://www.google.co.kr/textinputassistant/tia.png
