10.표준 라이브러리 둘러보기
------

### 10.1 운영 체제 인터페이스

OS 모듈은 운영 체제와 상호 작용하기 위한 수십 가지 함수 제공
- OS : https://docs.python.org/ko/3/library/os.html#module-os
- 개인정보 보호 차원에서 파일경로를 나타내는 함수들은 출력하지 않음

In [1]:
import os

In [5]:
# 현재 디렉토리 경로를 string 방식으로 전달

# os.getcwd()

In [None]:
# Change current working directory

# os.chdir('/server/accesslogs')   

In [7]:
# Run the command mkdir in the system shell
# 이걸 이용하면 macOS 기준 terminal에서 사용하는 명령어를 실행할 수 있다.

# os.system('mkdir today')
# os.system('touch test.py')

> from os import * 대신에 import os 스타일을 사용해야 합니다. 그래야 os.open() 이 내장 open() 을 가리는 것을 피할 수 있는데, 두 함수는 아주 다르게 동작합니다.

> os 와 같은 큰 모듈과 작업할 때, 내장 dir() 과 help() 함수는 대화형 도우미로 쓸모가 있습니다.



In [10]:
# <returns a list of all module functions>

dir(os)[0:10]

['CLD_CONTINUED',
 'CLD_DUMPED',
 'CLD_EXITED',
 'CLD_TRAPPED',
 'DirEntry',
 'EX_CANTCREAT',
 'EX_CONFIG',
 'EX_DATAERR',
 'EX_IOERR',
 'EX_NOHOST']

In [12]:
# <returns an extensive manual page created from the module's docstrings>

# help(os)

> 일상적인 파일과 디렉터리 관리 작업을 위해, shutil 모듈은 사용하기 쉬운 더 고수준의 인터페이스를 제공합니다:

In [13]:
import shutil

In [19]:
# https://wikidocs.net/26#with

with open('data.txt', 'w') as file:
    for i in range(10):
        file.write(str(i) + '\n')

In [20]:
# shutil.copyfile을 이용하면 파일을 복사할 수 있다.

shutil.copyfile('data.txt', 'archive.txt')

'archive.txt'

### 10.2 파일 와일드카드

> glob 모듈은 디렉터리 와일드카드 검색으로 파일 목록을 만드는 함수를 제공합니다:

- glob : https://docs.python.org/ko/3/library/glob.html#module-glob

In [21]:
import glob

glob.glob('*.txt')

['archive.txt', 'data.txt']

### 10.3 명령행 인자

일반적인 유틸리티 스크립트는 종종 명령행 인자를 처리해야 할 필요가 있습니다. 이 인자들은 sys 모듈의 argv 어트리뷰트에 리스트로 저장됩니다. 

예를 들어, 명령행에서 python demo.py one two three 를 실행하면 다음과 같은 결과가 출력됩니다

In [22]:
import sys

In [24]:
# print(sys.argv)

Example code

```python
import sys
print(sys.argv)

['demo.py', 'one', 'two', 'three']
```

argparse 모듈은 명령 줄 인자를 처리하는 더 정교한 메커니즘을 제공합니다. 다음 스크립트는 하나 이상의 파일명과 선택적으로 표시할 줄 수를 추출합니다
- argparse : https://docs.python.org/ko/3/library/argparse.html#module-argparse

```python
import argparse

parser = argparse.ArgumentParser(prog = 'top',
    description = 'Show top lines from each file')
parser.add_argument('filenames', nargs='+')
parser.add_argument('-l', '--lines', type=int, default=10)
args = parser.parse_args()
print(args)
```

예전에 작업하던 코드 부분 발췌

```python
def run(argument_parser):
    args = argument_parser.parse_args()
    file_name = args.file_name

    string_list = read_csv(file_name)
    contents_data = extract_contents_info(string_list)

    csv_file_name = get_sample_file_name()
    save_sample_video_info(contents_data, csv_file_name)


if __name__ == "__main__":
    argument_parser = argparse.ArgumentParser()
    argument_parser.add_argument(
        '-file',
        '--file_name',
        type=str,
        default=None,
        help="-----------"
    )

    run(argument_parser)
```

### 10.4. 에러 출력 리디렉션과 프로그램 종료
sys 모듈은 stdin, stdout, stderr 어트리뷰트도 갖고 있습니다. 가장 마지막 것은 stdout 이 리디렉트 되었을 때도 볼 수 있는 경고와 에러 메시지들을 출력하는데 쓸모가 있습니다:


```python
sys.stderr.write('Warning, log file not found starting a new one\n')
Warning, log file not found starting a new one
```

스크립트를 종료하는 가장 직접적인 방법은 sys.exit() 를 쓰는 것입니다.

In [26]:
# sys.exit()

### 10.5 문자열 패턴 매칭

re 모듈은 고급 문자열 처리를 위한 정규식 도구들을 제공합니다. 복잡한 매칭과 조작을 위해, 정규식은 간결하고 최적화된 솔루션을 제공합니다
- re : https://docs.python.org/ko/3/library/re.html#module-re

In [27]:
import re

In [28]:
re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')

['foot', 'fell', 'fastest']

In [29]:
re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')

'cat in the hat'

### 10.6 수학

math 모듈은 부동 소수점 연산을 위한 하부 C 라이브러리 함수들에 대한 액세스를 제공합니다.
- https://docs.python.org/ko/3/library/math.html#module-math

In [1]:
import math

math.cos(math.pi / 4)

0.7071067811865476

In [2]:
math.log(1024, 2)

10.0

In [3]:
import random

random.choice(['apple', 'pear', 'banana'])

'banana'

What does it mean without replacement?

- Sampling Without Replacement. Sampling without Replacement is a way to figure out probability without replacement. In other words, you don't replace the first item you choose before you choose a second. This dramatically changes the odds of choosing sample items.2016. 5. 8.
- https://www.statisticshowto.datasciencecentral.com/sampling-with-replacement-without/

In [4]:
random.sample(range(100), 10) # sampling without replacement

[37, 40, 25, 75, 34, 45, 46, 78, 91, 51]

In [5]:
random.random() # random float

0.7769188333048614

In [7]:
random.randrange(6)    # random integer chosen from range(6)

4

In [8]:
random.randrange(100)

91

In [9]:
import statistics

data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]
statistics.mean(data)

1.6071428571428572

In [10]:
statistics.median(data)

1.25

In [11]:
statistics.variance(data)

1.3720238095238095

SciPy 프로젝트 <https://scipy.org> 는 다른 수치 계산용 모듈들을 많이 갖고 있습니다.

### 10.7. 인터넷 액세스

인터넷을 액세스하고 인터넷 프로토콜들을 처리하는 많은 모듈이 있습니다. 가장 간단한 두 개는 URL에서 데이터를 읽어오는 urllib.request 와 메일을 보내는 smtplib 입니다:

### 10.8 날짜와 시간

- datetime 모듈은 날짜와 시간을 조작하는 클래스들을 제공하는데, 간단한 방법과 복잡한 방법 모두 제공합니다. 날짜와 시간 산술이 지원되지만, 구현의 초점은 출력 포매팅과 조작을 위해 효율적으로 멤버를 추출하는 데에 맞춰져 있습니다. 모듈은 시간대를 고려하는 객체들도 지원합니다.
- https://docs.python.org/ko/3/library/datetime.html#module-datetime

In [12]:
from datetime import date

In [13]:
now = date.today()
print(now)

2020-03-27


In [16]:
now

datetime.date(2020, 3, 27)

In [18]:
now.year, now.month, now.day

(2020, 3, 27)

In [19]:
now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")

'03-27-20. 27 Mar 2020 is a Friday on the 27 day of March.'

In [20]:
# dates support calendar arithmetic
birthday = date(1964, 7, 31)
age = now - birthday
print(age.days)

20328


### 10.9. 데이터 압축
일반적인 데이터 보관 및 압축 형식들을 다음과 같은 모듈들이 직접 지원합니다: zlib, gzip, bz2, lzma, zipfile, tarfile.

### 10.10. 성능 측정
일부 파이썬 사용자들은 같은 문제에 대한 다른 접근법들의 상대적인 성능을 파악하는데 깊은 관심을 두고 있습니다. 파이썬은 이런 질문들에 즉시 답을 주는 측정 도구를 제공합니다.

예를 들어, 인자들을 맞교환하는 전통적인 방식 대신에, 튜플 패킹과 언 패킹을 사용하고자 하는 유혹을 느낄 수 있습니다. timeit 모듈은 적당한 성능 이점을 신속하게 보여줍니다:
- https://docs.python.org/ko/3/library/timeit.html#module-timeit

timeit 의 정밀도와는 대조적으로, profile 과 pstats 모듈은 큰 블록의 코드에서 시간 임계 섹션을 식별하기 위한 도구들을 제공합니다.

### 10.11. 품질 관리

고품질의 소프트웨어를 개발하는 한 가지 접근법은 개발되는 각 함수에 대한 테스트를 작성하고, 그것들을 개발 프로세스 중에 자주 실행하는 것입니다.

doctest 모듈은 모듈을 훑어보고 프로그램의 독스트링들에 내장된 테스트들을 검사하는 도구를 제공합니다. 테스트 만들기는 평범한 호출을 그 결과와 함께 독스트링으로 복사해서 붙여넣기를 하는 수준으로 간단해집니다. 사용자에게 예제를 함께 제공해서 설명서를 개선하고, doctest 모듈이 설명서에서 코드가 여전히 사실인지 확인하도록 합니다.

In [21]:
def average(values):
    """Computes the arithmetic mean of a list of numbers.

    >>> print(average([20, 30, 70]))
    40.0
    """
    return sum(values) / len(values)

In [22]:
import doctest
doctest.testmod()

TestResults(failed=0, attempted=1)

In [23]:
import unittest

class TestStatisticalFunctions(unittest.TestCase):

    def test_average(self):
        self.assertEqual(average([20, 30, 70]), 40.0)
        self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
        with self.assertRaises(ZeroDivisionError):
            average([])
        with self.assertRaises(TypeError):
            average(20, 30, 70)

unittest.main()  # Calling from the command line invokes all tests

E
ERROR: /Users/wontaek/Library/Jupyter/runtime/kernel-7e882230-2133-4f51-8f35-864f77356f70 (unittest.loader._FailedTest)
----------------------------------------------------------------------
AttributeError: module '__main__' has no attribute '/Users/wontaek/Library/Jupyter/runtime/kernel-7e882230-2133-4f51-8f35-864f77356f70'

----------------------------------------------------------------------
Ran 1 test in 0.001s

FAILED (errors=1)


SystemExit: True

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
