# 개요

파이썬의 많은 장점 가운데 하나가 다양한 기능을 제공하는 라이브러리를 사용할 수 있다는 것이다. 특히 파이썬이 설치될 때부터 기본적으로 포함하는 표준 라이브러리에는 정규 표현부터 HTTP 통신에 이루기까지 현대적인 정보 처리에 있어서 매우 널리 사용되는 라이브러리들이 포함되어 있다. 그러나 표준 라이브러리에 모든 라이브러리를 포함할 수는 없기에 사용자에 의한 라이브러리 패키지의 설치, 삭제, 업데이트 등의 관리가 **필수적으로** 이루어져야 한다. 

# 기본 개념
라이브러리와 관련하여 기본적인 개념들을 정리해 보자.

* **라이브러리(library)**: 라이브러리는 매우 일반적인 표현으로 목적과 용도가 긴밀히 관련된 파이썬 상수와 함수 등의 정의를 하나의 집합적인 단위로 묶어놓은 것을 말한다. 예를 들어 수학에 관련된 것들을 모아놓은 라이브러리는 수학 라이브러리라 부르며, 전자우편에 관련된 것들을 모아놓은 라이브러리는 전자우편 라이브러리이다.
* **모듈(module)**: 모듈은 하나의 파이썬 파일(예: `time.py`)로 제공되는 라이브러리의 제공 형태를 말한다. 파이썬 튜토리얼 문서에 따르면 모듈이란 정의와 문을 담고 있는 파이썬 파일(a file containing Python definitions and statements)을 의미한다. 모듈은 다른 스크립트에 의해 임포트(`import`)되어 사용된다.
* **패키지(package)**: 패키지는 여러 개의 모듈로 구성된 복잡한 라이브러리의 제공 형태를 말한다. 모듈들은 계층적으로 구성될 수도 있다. 관련되어 있지만 약간 다른 뜻으로는 배포를 위해 정해진 규칙에 따라 조성된 파일(대체로 특화된 압축 파일)을 가리키기도 한다.
* **패키지 관리자(package manager)**: 패키지의 설치, 삭제, 업데이트 등의 관리 업무를 수행하는 도구를 말한다. 파이썬 표준 패키지 관리자는 pip(<https://pip.pypa.io>)이다.
* **패키지 저장소(package repository)**: 정해진 규칙에 따라 조성된 패키지 파일들의 효율적인 온라인 배포를 위해 모아놓는 온라인 패키지 저장소를 의미한다. 가장 규모가 크고 널리 사용되는 파이썬 패키지 저장소는 PyPI - the Python Package Index(<https://pypi.python.org>)이다. 패키지 저장소는 패키지 파일의 저장만 아니라 패키지 관리자와의 연동을 통한 패키지의 설치, 업그레이드 등의 기능을 제공한다.

# 표준 배포판 포함 여부에 따른 라이브러리의 분류, 그리고 아나콘다 파이썬
파이썬 표준 배포판이라 함은 파이썬 공식 사이트(<https://www.python.org>)에서 플랫폼과 운영체제별로 설치 프로그램 형식으로 제공하는 파이썬 배포판을 의미한다.

* **표준 라이브러리**: 유용하여 사용자들이 자주 사용하는 라이브러리들을 골라서 표준 배포판에 포함한 라이브러리를 표준 라이브러리라 한다. 표준 라이브러리는 고정되지 않고 새로이 추가되거나 제거되기도 한다. 파이썬의 버전이 올라가면서 새로 추가된 라이브러리를 이전 버전 파이썬의 개정판에 추가하기도 하는데 이를 백포트(backports)라 부른다.
* **제3자 라이브러리**: IT 세계에서 제3자(third party)란 제작사(판매자)와 고객(구매자)이 아닌 공급자를 말한다. 그러므로 파이선에 제3자 라이브러리라 함은 표준 라이브러리가 아니며, 개별 사용자가 직접 만들지 않은 라이브러리들을 통칭하는 표현이다. 앞서 언급한 파이썬 패키지 인덱스(PyPI)는 대표적인 파이썬 제3자 라이브러리 저장소이며, 표준 파이썬 패키지 관리자인 pip을 이용하여 제3자 라이브러리의 설치와 업그레이가 가능하다.

한편 아나콘다 파이썬 등의 특화된 배포판들은 배포판의 특성에 부합하는 제3자 라이브러리들을 선별하여 배포판에 포함한다. 예를 들어 데이터 과학 작업에 특화된 아나콘다 파이썬은 표준 라이브러리에 속하지는 않지만 널리 사용되는 requests, beautifulsoup 등의 라이브러리들을 기본적으로 포함하고 있다.

또한 아나콘다 파이썬은 자체 저장소를 통해 데이터 과학 작업에 유용한 제3자 라이브러리들을 선별하여 관리한다. 예를 들어 ujson 라이브러리는 아나콘다 패키지 저장소에서 관리된다. 아나콘다 패키지 저장소에 있는 라이브러리들은 아나콘다 파이썬의 패키지 관리자인 conda를 이용해 설치와 업그레이드를 할 수 있다.

>리눅스와 맥오에스는 운영체제에 파이썬을 기본적으로 포함하고 있다. 단순히 포함되었을 뿐만 아니라 운영체제의 여러 부분에서 파이썬을 이용하기도 한다. 운영체제에 포함된 파이썬은 대체로 표준 파이썬 배포판을 운영체제에 맞게 일부 수정한 것이다. 때로는 운영체제에 기본적으로 포함된 파이썬의 확장성이 떨어져 별도의 파이썬 배포판을 설치해야 하는 경우도 있다.

# 작성 언어에 따른 라이브러리의 분류, 그리고 윈도우
파이썬 라이브러리는 파이썬 언어로 작성하는 것이 당연하다고 여겨진다. 파이썬은 초기 개발 단계부터 C/C++ 언어와의 연계를 염두에 두었다. 따라서 많은 고성능 라이브러리들이 C/C++로 작성되었다.

* **순수 파이썬(pure Python) 라이브러리**: 순수하게 파이썬으로만 작성한 라이브러리이다.
* **C/C++ 확장(C/C++ extension) 라이브러리**: C/C++와 파이썬을 결합하여 작성한 라이브러리이다.

파이썬은 동일한 소스로 여러 플랫폼에서 수정없이 사용할 수 있는 스크립트 언어이므로 순수 파이썬 라이브러리의 설치는 쉽고도 간단하게 이루어진다. 그러나 C/C++ 확장 라이브러리의 경우에는 사정이 다르다. C/C++ 확장 라이브러리에 포함된 C/C++ 소스는 플랫폼과 운영체제, 그리고 파이썬 버전별로 컴파일 과정을 거쳐야 해당 라이브러리의 설치가 가능하다. 즉, C/C++ 확장 라이브러리를 설치하려면 사용자의 운영체제에 파이썬 인터프리터를 조성할 때에 사용한 것과 호환되는 C/C++ 컴파일러가 설치되어 있어야 한다.

위의 상황은 리눅스나 맥오에스에서는 어렵지 않게 대처할 수 있다. 리눅스에서는 리눅스 패키지 관리자를 통해 쉽게 C/C++ 컴파일러를 설치할 수 있으며, 맥오에스에서는 무료로 제공되는 Xcode를 앱스토어를 통해 설치할 수 있다. 즉, C/C++ 컴파일러 설치에 장애가 될 수 있는 비용 문제와 번거로운 설치 문제가 리눅스와 맥오에스는 없다.

한편 윈도우에서는 C/C++ 컴파일러 설치가 결코 간단하지 않다. 최근에는 무료로 사용할 수 있는 익스프레스판 혹은 커뮤니티판이 나왔지만 얼마 전까지 윈도우의 표준 C/C++ 컴파일러인 마이크로소프트 비주얼 C/C++는 상당히 고가였다. 또한 마이크로소프트 비주얼 C/C++를 설치한다고 해도 이를 파이썬 C/C++ 확장 라이브러리 컴파일을 위한 환경을 구축하는 것도 상당히 번거로운 일이다.

사정이 이러하다 보니 파이썬 커뮤니티에서는 C/C++ 확장 라이브러리를 C/C++ 컴파일러가 없더라도 쉽게 설치할 수 있도록 플랫폼과 운영체제, 그리고 파이썬 버전별로 미리 컴파일된 바이너리 패키지의 제공을 라이브러리 저자들에게 권장하고 있다. 그러나 이는 권장 사항일뿐 아직도 바이너리 패키지가 제공되지 않는 C/C++ 확장 라이브러리가 매우 많다. 예를 들어, 고속의 JSON 인코딩과 디코딩 기능을 가진 C/C++ 확장 라이브러리인 ujson의 경우 PyPI에서 소스 패키지만 제공하고 바이너리 패키지는 제공하지 않는다. 따라서 pip을 이용하여 이 라이브러리를 설치하려면 C/C++ 컴파일러가 필요하다.

다행히도 윈도우 비친화적인 현 상황을 조금이라도 극복하기 위하여 몇몇 단체와 개인이 윈도우용 바이너리 패키지를 조성하여 제공하고 있다. 아나콘다 파이썬에서도 데이터 과학 작업을 위해 널리 사용되는 C/C++ 확장 라이브러리를 플랫폼, 운영체제, 그리고 파이썬 버전별로 바이너리 패키지로 조성하여 자체 패키지 저장소에서 유지하고 있다. 이러한 라이브러리들은 아나콘다 파이썬 패키지 관리자인 conda를 통해 쉽게 설치하고 업그레이드할 수 있다.

윈도우에서 아나콘다 파이썬을 사용하지 않거나 아나콘다 패키지 저장소에서 유지되지 않는 C/C++ 확장 라이브러리를 사용해야 하는 경우 사막의 오아시스와 같은 곳이 있다. 바로 비공식 윈도우 바이너리 파이썬 라이브러리 배포 사이트(Unofficial Windows Binaries for Python Extension Packages, <http://www.lfd.uci.edu/~gohlke/pythonlibs>)이다. 이곳에서는 널리 쓰이는 C/C++ 확장 라이브러리들의 바이너리 패키지를 제공한다.

# 패키지 관리자 사용하기
먼저 아나콘다 파이썬 패지기 관리자인 conda를 사용해보자. conda는 명령행 도구이다. 그러므로 명령 프롬프트를 실행하여야 한다. 그런데 아나콘다 파이썬 4.4부터는 아나콘다 파이썬 실행 파일들이 들어있는 디렉토리를 실행 파일을 찾는 경로 설정을 하지 않는 것이 기본 설정이므로 다음 그림과 같이 [메뉴]-[Anaconda3 (64bit)]-[Anaconda Prompt]를 실행하여 아나콘다 명령행 창을 실행한다.

![응용 프로그래 메뉴를 통한 아나콘다 명령행 창 실행](figs/prg-ana-cmd.png)

이제 C/C++ 확장 라이브러리인 ujson을 설치해 보자. 다음과 같이 `conda install ujson` 명령을 입력하고 [ENTER]를 눌러 명령을 실행하고 물음에 `y`로 답하면 패키지 설치가 진행된다.

![conda를 이용한 ujson 모듈 설치](figs/ana-cmd-conda.png)

위의 화면을 잘 살펴보면 ujson 라이브러리의 설치와 함께 conda 자체의 업그레이드도 이루어졌음을 볼 수 있다.

윈도우에서 아나콘다 파이썬을 사용하지 않는 사용자는 앞서 언급한 비공식 윈도우 바이너리 파이썬 라이브러리 배포 사이트(<http://www.lfd.uci.edu/~gohlke/pythonlibs>)에서 ujson 라이브러리의 바이너리 패키지를 내려받아 사용자 홈디렉토리에 저장해야 한다.

![ujson 비공식 바이너리 패키지 내려받기](figs/ujson-wheel.png)

앞서 설명한 것처럼 바이너리 패키지는 플랫폼과 파이썬 버전별로 구분하여 조성하므로 사용자의 환경에 맞는 것을 내려 받아야 한다. 내려받은 후에는 다음과 같이 명령행에서 `pip` 명령으로 바이너리 패키지를 설치한다.

```
C:\Users\leekh>pip install ujson-1.35-cp36-cp36m-win_amd64.whl
```

별다른 메시지 없이 바로 설치가 된다. 설치 후에는 내려받은 바이너리 패키지를 지워도 된다. 리눅스나 맥오에스에서 **아나콘다 파이썬을 사용하지 않는 경우**에는 다음과 같이 한다. 그러면 PyPI에서 소스 패키지가 내려받아진 후 C/C++ 컴파일러를 통해 바이너리 패키지 설치 과정을 거친 후 패키지 설치가 끝난다.

```
$ pip3 install ujson
```

`pip`의 실행 명령이 `pip3`인 것은 리눅스나 맥오에스에서 파이썬 3을 설치했을 때 파이썬 2의 `pip`과 구별하기 위해 `pip`을 `pip3`로 이름 붙이는 관례에 따른 것이다. 실제로는 사용자의 시스템의 환경에 맞는 명령어를 사용해야 한다. conda와 pip의 주요 명령은 다음과 같다.

```
# 패키지 설치
> conda install pkg_name
> pip install pkg_name

# 패키지 삭제
> conda remove pkg_name
> pip uninstall pkg_name

# 패키지 업그레이드
> conda upgrade pkg_name
> pip install --upgrade pkg_name

# 설치한 패키지 목록 보기
> conda list
> pip list

# 저장소에서 패키지 검색하기
> conda search pkg_name
> pip search pkg_name
```

conda와 pip의 자세한 사용 방법은 각각의 도구의 온라인 매뉴얼인 <https://conda.io/docs>와 <https://pip.pypa.io/en/latest/user_guide>를 참조하기 바란다.