In [None]:
# 16장 인터넷 프로토콜 다루기
# 인터넷에는 많은 프로토콜이 있다. 예를 들어 웹을 사용하기 위한 HTTP, 파일 전송을 위한 FTP, 메일 송수신을 위한 SMTP와 POP3 등을 들 수 있다. 이번 장에서는 이러한 인터넷 프로토콜과 관련된 파이썬 모듈을 알아본다.

## 086 웹 브라우저를 실행하려면? ― webbrowser


In [None]:
# 086 웹 브라우저를 실행하려면? ― webbrowser
# webbrowser는 파이썬 프로그램에서 시스템 브라우저를 호출할 때 사용하는 모듈이다.

# 문제
# 개발 중 궁금한 내용이 있어 파이썬 문서를 참고하려 한다. 이를 위해 https://python.org 사이트를 새로운 웹 브라우저로 열려면 코드를 어떻게 작성해야 할까?



# 풀이
# 파이썬으로 웹 페이지를 새 창으로 열려면 webbrowser 모듈의 open_new() 함수를 사용한다.

# [파일명: webbrowser_sample.py]

# import webbrowser

# webbrowser.open_new('http://python.org')

# 이미 열린 브라우저로 원하는 사이트를 열고 싶다면 다음처럼 open_new() 대신 open()을 사용하면 된다.

# webbrowser.open('http://python.org')
# 참고
# webbrowser - 편리한 웹 브라우저 제어기: https://docs.python.org/ko/3/library/webbrowser.html

In [1]:
import webbrowser

webbrowser.open_new('http://python.org')

True

In [None]:
# 087 서버에서 실행하는 프로그램을 만들려면? ― cgi

# cgi는 CGI 프로그램을 만드는 데 필요한 도구를 제공하는 모듈이다.

# CGI란 공통 게이트웨이 인터페이스(Common Gateway Interface)의 약어로, 
# 웹 서버와 외부 프로그램 사이에 정보를 주고받는 방법이나 규약을 말한다.

# 문제
# 두 수 a, b를 입력받아 곱한 다음 그 결과를 반환하는 CGI 프로그램은 어떻게 작성하면 될까? 
# 예를 들어 주소가 52.78.8.100인 서버에서 아파치 웹 서버가 8088 포트로 서비스 중일 때 다음과 같은 URL을 요청한다고 하자.

# http://52.78.8.100:8088/cgi-bin/multiple.py?a=3&b=5
# 이때 브라우저에 다음과 같은 결과를 출력하도록 CGI 프로그램을 만들어야 한다.

# Result: 15
# 아파치 서버에서 파이썬 프로그램을 실행하는 방법은 풀이 다음의 '아파치 설치하고 설정하기' 항을 참고하자.

# 풀이
# URL로 전달받은 두 개의 값 a, b를 얻으려면 다음과 같은 cgi.FieldStorage 클래스가 필요하다.

# import cgi
# form = cgi.FieldStorage()

# a = form.getvalue('a')
# b = form.getvalue('b')
# cgi.FieldStorage() 로 생성한 form 객체에 getvalue(매개변수 이름)을 호출하여 URL로 전달된 값을 얻을 수 있다. 
# 이때 URL로 얻은 2개의 값은 숫자가 아닌 문자열이므로 다음과 같이 숫자로 바꾸고 나서 곱해야 한다는 점에 주의하자.

# result = int(a) * int(b)
# 그런 다음, 웹 브라우저에 결괏값을 출력하려면 HTTP 규약에 따라 Content-type 항목과 빈 줄을 포함하여 다음처럼 출력해야 한다. 
# 여기서 사용한 Content-type: text/plain은 단순 텍스트로 출력하겠다는 뜻이다.

# print('Content-type: text/plain')
# print()
# print(f'Result:{result}')
# 두 수의 곱을 계산하고 반환하는 최종 CGI 프로그램인 multiple.py는 다음과 같다.

# [파일명: /var/www/cgi-bin/multiple.py]

# #!/usr/bin/python3
# import cgi
# form = cgi.FieldStorage()

# a = form.getvalue('a')
# b = form.getvalue('b')

# result = int(a) * int(b)

# print('Content-type: text/plain')
# print()
# print(f'Result:{result}')
# 파일명이 /var/www/cgi-bin/multiple.py인 이유는 아파치에서 CGI 프로그램을 실행할 수 있는 디렉터리로 /var/www/cgi-bin을 지정했기 때문이다. 자세한 아파치 설정 내용은 다음 항에서 확인하자.

# 맨 윗줄 #!/usr/bin/python3은 아파치가 multiple.py 파일을 호출할 때 사용할 파이썬 프로그램의 경로이다. 즉, multiple.py 파일을 /usr/bin/python3 파일로 실행하겠다는 뜻이다. 유닉스 환경에서 파일을 단독으로 실행하려면 이렇게 파일 맨 위에 해당 파일을 실행할 때 호출해야 하는 프로그램의 전체 경로(#!를 포함한 경로)를 적는데, 이를 셔뱅(shebang) 커맨드라 한다.

# URL을 호출한 결과는 다음과 같다.
# http://192.168.200.100:8088/cgi-bin/multiple.py?a=3&b=5


# 아파치 설치하고 설정하기
# 리눅스(예: 우분투)에서 파이썬 CGI 프로그램을 사용하려면 아파치 설치, 포트 변경, CGI 설정 등의 절차를 따라야 한다.

# 알아두면 좋아요
# 파이썬으로 CGI 서버 만들기
# 아파치와 같은 웹 서버를 설치하지 않고 파이썬만으로 웹 서버를 구동하고 CGI를 실행하는 방법은 100절을 참고하자.

# 참고: 100 테스트용 HTTP 서버를 만들려면? - http.server

# 아파치 설치
# ----------
# 먼저 다음 명령어로 아파치를 설치한다.

# $ sudo apt-get update
# $ sudo apt-get install apache2
# 포트 변경
# 아파치 설치가 끝났다면 기본 HTTP 포트인 80과 SSL 포트인 443 대신 다른 포트를 사용하고자 다음처럼 포트 설정 파일을 변경한다.

# [파일명: /etc/apache2/ports.conf]

# Listen 8088

# <IfModule ssl_module>
#         Listen 8443
# </IfModule>

# <IfModule mod_gnutls.c>
#         Listen 8443
# </IfModule>
# 여기서는 80을 8088로, 443을 8443으로 변경했다.

# CGI 설정
# 아파치가 파이썬 프로그램을 호출하려면 다음과 같은 설정이 필요하다.

# ScriptAlias /cgi-bin/ /var/www/cgi-bin/
# ScriptAlias는 http://52.78.8.100:8088/cgi-bin/multiple.py와 같은 /cgi-bin/으로 시작하는 URL을 호출했을 때 
# /var/www/cgi-bin/ 디렉터리의 파일을 읽게 하는 설정이다. 
# 따라서 이렇게 설정한 후 웹 브라우저에서 http://52.78.8.100:8088/cgi-bin/multiple.py를 호출하면 서버의 /var/www/cgi-bin/multiple.py 파일을 호출한다.

# 이와 함께 /var/www/cgi-bin 디렉터리는 다음과 같이 설정해야 한다.

# <Directory /var/www/cgi-bin>
#     Options +ExecCGI
#     AddHandler cgi-script .py
# </Directory>
# Options +ExecCGI는 /var/www/cgi-bin 디렉터리가 CGI 파일을 실행할 수 있는 경로라는 의미이고 AddHandler cgi-script .py는 CGI 파일로 .py 확장자에 해당하는 파이썬 스크립트를 사용하겠다는 의미이다.

# 이러한 CGI 설정을 적용하려면 다음 아파치 설정 파일을 수정해야 한다.

# [파일명: /etc/apache2/sites-enabled/000-default.conf]

# <VirtualHost *:8088>  # 80 포트를 8088 포트로 변경
#         ServerAdmin webmaster@localhost
#         DocumentRoot /var/www/html

#         ErrorLog ${APACHE_LOG_DIR}/error.log
#         CustomLog ${APACHE_LOG_DIR}/access.log combined

#         ScriptAlias /cgi-bin/ /var/www/cgi-bin/
#         <Directory /var/www/cgi-bin>
#           Options +ExecCGI
#           AddHandler cgi-script .py
#         </Directory>
# </VirtualHost>
# 80 포트 대신 8088로 변경했다면 이처럼 <VirtualHost *:8088>로 변경해야 한다.

# 마지막으로 아파치가 cgi 기능을 사용할 수 있도록 cgi.load 파일을 활성화(enable)한다.

# $ cd /etc/apache2/mods-enabled
# $ sudo ln -s ../mods-available/cgi.load
# 그리고 cgi-bin 디렉터리를 다음과 같이 생성한다.

# $ cd /var/www/
# $ sudo mkdir cgi-bin
# 디렉터리를 생성했다면 작성한 multiple.py 파일을 /var/www/cgi-bin 디렉터리로 이동한다.

# $ sudo mv ~/multiple.py /var/www/cgi-bin
# 여기서는 multiple.py 파일이 홈 디렉터리(~/)에 있다고 가정한 mv 명령이다.

# CGI 파일 권한
# 작성한 CGI 파일(예: multiple.py)을 아파치가 실행할 수 있도록 다음과 같이 실행 권한을 주어야 한다.

# $ cd /var/www/cgi-bin
# $ chmod a+x multiple.py
# chmod는 파일이나 디렉터리에 접근 권한을 지정하는 명령이며 a+x는 모든 사용자(a)에게 실행 권한(x)을 부여한다는 뜻으로, +x와 같다. 참고로 +는 권한 부여, -는 권한 제거이다.

# 아파치 재시작
# 아파치 설정이 바뀌었으므로 다음 명령으로 아파치를 다시 시작한다.

# $ sudo systemctl restart apache2.service
# 참고
# cgi - Common Gateway Interface support(영문): https://docs.python.org/ko/3/library/cgi.html

## 088 CGI 프로그램의 오류를 바로 확인하려면? ― cgitb

In [None]:
# 088 CGI 프로그램의 오류를 바로 확인하려면? ― cgitb
# cgitb는 CGI 프로그램의 오류를 쉽게 파악하는 데 사용하는 모듈이다.

# 문제
# 앞 절장에서 만들었던 CGI 프로그램을 다음과 같이 호출하면 오류(Internal Server Error)가 발생한다.

# 087 서버에서 실행하는 프로그램을 만들려면? - cgi

# http://52.78.8.100:8088/cgi-bin/multiple.py?a=3&b=x
# 오류가 발생한 이유는 b 매개변수에 숫자가 아닌 문자 x를 전달했기 때문이다. 화면에는 단순히 Internal Server Error를 표시하지만, 구체적인 오류 내용은 다음처럼 아파치 로그 파일 error.log로 확인할 수 있다.

# [파일명:/var/log/apache2/error.log]

# [Tue May 25 08:57:00.915106 2021] [cgi:error] [pid 31244:tid 139627615545088] [client 1.241.252.137:6466] AH01215: Traceback (most recent call last):: /var/www/cgi-bin/multiple.py
# [Tue May 25 08:57:00.915292 2021] [cgi:error] [pid 31244:tid 139627615545088] [client 1.241.252.137:6466] AH01215:   File "/var/www/cgi-bin/multiple.py", line 12, in <module>: /var/www/cgi-bin/multiple.py
# [Tue May 25 08:57:00.915347 2021] [cgi:error] [pid 31244:tid 139627615545088] [client 1.241.252.137:6466] AH01215:     result = int(a) * int(b): /var/www/cgi-bin/multiple.py
# [Tue May 25 08:57:00.915422 2021] [cgi:error] [pid 31244:tid 139627615545088] [client 1.241.252.137:6466] AH01215: ValueError: invalid literal for int() with base 10: 'x': /var/www/cgi-bin/multiple.py
# [Tue May 25 08:57:00.929125 2021] [cgi:error] [pid 31244:tid 139627615545088] [client 1.241.252.137:6466] End of script output before headers: multiple.py
# 하지만, 지금은 개발 단계이므로 오류 발생 시 일일이 error.log 파일을 확인하기보다는 화면에서 바로 오류 원인을 확인하고자 한다. CGI 프로그램의 오류 스택 트레이스를 브라우저 화면에 바로 출력하려면 어떻게 프로그램을 변경해야 할까?

# 풀이
# CGI 프로그램의 오류를 추적하는 가장 좋은 방법은 cgitb를 사용하는 것이다. 방법은 간단하다. 기존 프로그램에 다음의 2줄을 삽입하기만 하면 된다.

# import cgitb
# cgitb.enable()
# 그리고 cgitb는 기본적으로 오류 트레이스를 HTML로 화면에 출력하므로 Content-type도 다음처럼 text/plain이 아닌 text/html로 변경해야 오류를 제대로 볼 수 있다.

# print('Content-type: text/html')
# 그리고 한 가지 주의해야 할 사항으로는 오류가 발생하는 시점이 Content-type을 출력한 이후가 되어야 한다는 점이다. 오류가 먼저 발생하고 그다음 Content-type을 출력하는 문장이 나온다면 문서 타입을 출력하지 않은 상태에서 오류 HTML을 출력하려고 하기 때문에 아파치 오류 로그에 다음과 같은 오류가 발생하고 화면에는 여전히 Internal Server Error만 표시될 것이다.

# Response header name '<!--' contains invalid characters, aborting request
# 따라서 Content-type은 항상 스크립트 맨 위에 먼저 출력해야 한다. 이러한 내용을 적용한 최종 풀이는 다음과 같다.

# [파일명: /var/www/cgi-bin/multiple.py]

# #!/usr/bin/python3
# import cgi
# import cgitb
# cgitb.enable()

# print('Content-type: text/html')  # Content-type을 가장 먼저 출력
# print()

# form = cgi.FieldStorage()

# a = form.getvalue('a')
# b = form.getvalue('b')

# result = int(a) * int(b)

# print(f'Result:{result}')

# cgitb.enable()로 cgitb 기능을 활성화하고 Content-type을 text/html 형태로 스크립트 맨 위에 먼저 출력했다. 이렇게 코드를 수정하고 다시 오류가 발생하는 URL을 호출하면 이제 Internal Server Error 대신 다음과 같은 화면을 보게 될 것이다.



# 화면에 출력된 오류 내용을 보면 소스 어느 부분에서 오류가 발생했는지 정확하게 알 수 있고 이를 참고로 디버깅도 할 수 있다.

# 참고
# cgitb - CGI 스크립트를 위한 트레이스백 관리자: https://docs.python.org/ko/3/library/cgitb.html

## 089 웹 서버 응용 프로그램을 만들려면? ― wsgiref


In [None]:
# 089 웹 서버 응용 프로그램을 만들려면? ― wsgiref
# wsgiref는 WSGI 프로그램을 만들 때 사용하는 모듈이다.

# 알아두면 좋아요
# WSGI란?
# -------
# WSGI(Web Server Gateway Interface)는 웹 서버 소프트웨어와 파이썬으로 만든 웹 응용 프로그램 간의 표준 인터페이스이다. 쉽게 말해 웹 서버가 클라이언트로부터 받은 요청을 파이썬 애플리케이션에 전달하여 실행하고 그 실행 결과를 돌려받기 위한 약속이다.

# 문제
# 웹 브라우저 주소 창으로 두 수를 입력받아 곱한 다음 그 결과를 반환하는 WSGI 프로그램을 만들려면 어떻게 해야 할까?

# 참고 : 087 서버에서 실행하는 프로그램을 만들려면? - cgi

# http://52.78.8.100:8088/?a=3&b=4
# 예를 들어 서버의 IP 주소가 52.78.8.100 이고 8088 포트로 아파치 웹 서버를 운영할 때 이처럼 URL을 요청하면 브라우저에 다음과 같은 결과가 출력되도록 WSGI 프로그램을 작성해야 한다.

# Result: 12
# 풀이
# WSGI를 구현한 웹 프로그램을 작성하려면 다음처럼 WSGI 규칙에 맞는 wsgi.py 파일을 작성하고 이를 웹 서버에서 실행할 수 있게 설정하면 된다.

# 아파치에서 WSGI를 설정하는 방법은 풀이 다음에 설명한다.

# [파일명: /var/www/wsgi/wsgi.py]

# from cgi import parse_qs

# def application(environ, start_response):
#     params = parse_qs(environ['QUERY_STRING'])
#     a = params.get('a', [0])[0]
#     b = params.get('b', [0])[0]
#     result = int(a) * int(b)

#     status = '200 OK'  # HTTP Status
#     headers = [('Content-type', 'text/plain; charset=utf-8')]  # HTTP Headers
#     start_response(status, headers)

#     return [f'Result:{result}'.encode('utf-8')]

# 입력 매개변수로 environ, start_response를 수신하고 리스트 형태의 바이트 문자열을 반환하는 application() 함수를 구현하는 것이 WSGI의 규약이다.

# environ은 HTTP 요청에 대한 정보와 운영체제(OS)나 WSGI 서버 설정 등을 정의한 딕셔너리 변수이다. start_response()는 일종의 콜백 함수로, 응답 상태 코드와 HTTP 헤더를 설정하는 역할을 한다. start_response() 함수는 응답을 반환하기 전에 반드시 먼저 호출해야 한다.

# URL로 전달받은 a, b 두 개의 매개변수 값을 얻고자 environ 변수의 QUERY_STRING에 해당하는 값을 파싱했다. 이때 그 값을 편리하게 파싱하고자 urllib.parse 모듈의 parse_qs() 함수를 사용했다.

# 매개변수는 같은 이름으로 여러 개의 값을 전달할 수 있으므로 리스트 형태로 정의한다. 따라서 a 매개변수의 값을 얻고자 a = params.get('a', [0])[0]처럼 첫 번째 값만 얻을 수 있게 했다. 그리고 a = params.get('a', [0])에서 [0]은 a 매개변수를 요청에서 생략했을 때의 기본값을 의미한다.

# 아파치에 WSGI 설정하기
# 아파치에서 WSGI를 사용하려면 다음처럼 mod_wsgi 모듈을 설치해야 한다.

# ※ 참고: 087 서버에서 실행하는 프로그램을 만들려면? - cgi

# $ sudo apt-get install libapache2-mod-wsgi-py3
# 그리고 다음처럼 WSGI 설정을 아파치 서버 설정 파일에 추가한다.

# [파일명: /etc/apache2/sites-enabled/000-default.conf]

# <VirtualHost *:8088>
#         ServerAdmin webmaster@localhost
#         DocumentRoot /var/www/html

#         ErrorLog ${APACHE_LOG_DIR}/error.log
#         CustomLog ${APACHE_LOG_DIR}/access.log combined

#         ScriptAlias /cgi-bin/ /var/www/cgi-bin/
#         <Directory /var/www/cgi-bin>
#           Options +ExecCGI
#           AddHandler cgi-script .py
#         </Directory>

#         WSGIScriptAlias / /var/www/wsgi/wsgi.py
#         <Directory /var/www/wsgi>
#           <Files wsgi.py>
#             Require all granted
#           </Files>
#         </Directory>
# </VirtualHost>
# 이렇게 설정하고 다음 명령으로 아파치 웹 서버를 다시 시작하면 http://52.78.8.100:8088/처럼 /로 요청하는 URL은 모두 wsgi.py 파일이 담당하게 된다.

# $ sudo systemctl restart apache2.service
# wsgi.py 실행
# 이제 브라우저로 다음과 같은 URL을 호출해 보자.

# http://52.78.8.100:8088/?a=3&b=4
# http://52.78.8.100:8088이라는 IP 주소와 포트는 본인의 환경에 맞게 바꾸어 호출하자.



# 3과 4를 곱한 결과인 12를 출력하는 것을 확인할 수 있다.

# wsgiref.demo_app
# wsgiref 모듈의 demo_app은 Hello world!라는 문자열과 위에서 살펴본 environ의 모든 내용을 출력하는 도구이다. wsgi.py 파일을 다음과 같이 변경해 보자.

# [파일명: /var/www/wsgi/wsgi.py]

# from wsgiref.simple_server import demo_app

# application = demo_app
# 그러고 나서 브라우저에서 /을 요청하면 다음과 같은 결과를 볼 수 있다.



# wsgiref.simple_server
# wsgiref.simple_server 모듈을 사용하면 아파치와 같은 웹 서버가 없어도 WSGI 서버를 구동할 수 있다.

# [파일명: wsgiref_simple_server_sample.py]

# from cgi import parse_qs

# def application(environ, start_response):
#     params = parse_qs(environ['QUERY_STRING'])
#     a = params.get('a', [0])[0]
#     b = params.get('b', [0])[0]
#     result = int(a) * int(b)

#     status = '200 OK'  # HTTP Status
#     headers = [('Content-type', 'text/plain; charset=utf-8')]  # HTTP Headers
#     start_response(status, headers)

#     return [f'Result:{result}'.encode('utf-8')]


# if __name__ == "__main__":
#     from wsgiref.simple_server import make_server
#     with make_server('', 8088, application) as httpd:
#         print("Serving on port 8088...")
#         httpd.serve_forever()
# 단, 이렇게 간단한 wsgi 서버는 운영 환경에서는 적합하지 않으므로 테스트용으로만 사용해야 한다.

# 알아두면 좋아요
# 장고와 플라스크
# 장고(django)와 플라스크(flask)는 파이썬으로 만든 유명한 웹 프레임워크로, 이 둘 역시 WSGI 규약에 따라 개발한 파이썬 웹 애플리케이션이다. 장고를 설치해 보면 다음과 같은 wsgi.py 파일이 생성되는 것을 확인할 수 있다.

# [장고 프레임워크의 wsgi.py]

# """
# WSGI config for config project.

# It exposes the WSGI callable as a module-level variable named ``application``.

# For more information on this file, see
# https://docs.djangoproject.com/en/3.0/howto/deployment/wsgi/
# """

# import os

# from django.core.wsgi import get_wsgi_application

# os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'config.settings')

# application = get_wsgi_application()

# 이 소스의 application과 앞서 알아본 application() 함수의 규약은 똑같다.

# 참고
# wsgiref - WSGI 유틸리티와 참조 구현: https://docs.python.org/ko/3/library/wsgiref.html

In [None]:
from cgi import parse_qs

def application(environ, start_response):
    params = parse_qs(environ['QUERY_STRING'])
    a = params.get('a', [0])[0]
    b = params.get('b', [0])[0]
    result = int(a) * int(b)

    status = '200 OK'  # HTTP Status
    headers = [('Content-type', 'text/plain; charset=utf-8')]  # HTTP Headers
    start_response(status, headers)

    return [f'Result:{result}'.encode('utf-8')]