# 파이썬 라이브러리 레시피

python 3.x 대응

*이케우치 다카히로, 파이썬 라이브러리 레시피, 프리렉, 2016*

# 차례
## 1. [텍스트 처리](text)
## 2. [수치 계산](number)
## 3. [날짜와 시간]()
## 4. [자료형과 알고리즘]()
## 5. [범용 OS 서비스]()
## 6. [파일과 디렉토리]()
## 7. [압축파일 다루기]()
## 8. [특정 파일 다루기]()
## 9. [인터넷의 데이터]()
## 10. [테스트와 디버깅]()
## 11. [암호 관련]()
## 12. [병렬처리]()


<div id = 'text'/>

# 1. 텍스트 처리

파이썬에서는 문자열을 편리하게 다루는 기능을 여럿 제공합니다.

## 문자열 변환 방법

메서드 이름 | 설명 
---|---
upper() | 문자열을 모두 대문자로 변환
lower() | 문자열을 모두 소문자로 변환
swapcase() | 대문자는 소문자로 소문자는 대문자로 변환
replace(old, new) | old를 new로 찾아 바꾼다

대소문자 구분이 있는 알파멧일 때만 유효하며 한국어등 기타 언어에는 변하지 않습니다.

In [2]:
text = 'Hello'

print(text.upper())
print(text.lower())
print(text.swapcase())
print(text.replace('H','A'))

HELLO
hello
hELLO
Aello


## 서식화 방법
지정한 형식의 문자열을 작성하기 위한 `format()`에 대해 알아 볼게요.


In [4]:
print('{} is better than {}'.format('Beautiful','Ugly'))

Beautiful is better than Ugly


## 정규표현식 다루기

정규표현을 처리하는 `re`에 대해 살펴보겠습니다. 정자표현식이란 문자열의 패턴을 정의해 해당 패턴에 맞는 문자열을 찾거나 치환하는 기능을 가지고 있습니다. 자세히 알고 싶다면 [공식 문서](https://docs.python.org/2/library/re.html)를 참고하세요.

형식 | 설명 
---|---
re.search(pattern, string) | 지정된 문자열이 정규 표현에 일치하면 객체를 반환
re.match(pattern, string) | 지정된 문자열의 맨 앞글자부터 일치하는지 확인
re.compile(pattern) | 지정된 정규표현을 컴파일하여 객체로 반환한다
re.findall(string) | 지정된 문자열 안에 정규 표현식과 일치한 문자열을 리스트로 반환

In [8]:
import re

print(re.match('B','ABC'))
print(re.search('B','ABC'))

None
<_sre.SRE_Match object; span=(1, 2), match='B'>


In [9]:
regex = re.compile('\d+') # 문자 한 개 이상으로 된 숫자의 정규표현식
regex.findall('080-6465-4123')

['080', '6465', '4123']

<div id = 'number' />

# 2. 수치 계산

합을 구하는 `sum()`, 최댓값을 구하는 `max()` 함수등을 먼저 살펴 보겠습니다.

함수 이름 | 설명 
---|---
abs() | 절댓값을 구한다. 
max() | 주어진 값중에 최댓값을 반환한다.
min() | 주어진 값중에 최솟값을 반환한다.
sum() | 주저진 값의 총 합을 구한다
pow(x,y) | x의 y제곱을 구한다

In [10]:
print(abs(-13))
print(max([-1,123,6453]))
print(min([-1,123,6453]))
print(sum([-1,123,6453]))
print(pow(2,2))

13
6453
-1
6575
4


## math 모듈
수치 처리와 계산에 사용되는 `math`모듈의 대표적인 기능은 다음과 같습니다.

함수 이름 | 설명
---|---
math.log(x) | x의 자연로그를 구한다
math.log10(x) | 밑을 10으로 하는 x의 로그를 구한다
math.sqrt(x) | x의 거듭제곱(루트)을 구한다
math.sin(x) | 라디안 x의 사인을 구한다
math.cos(x) | 라디안 x의 코사인을 구한다
math.tan(x) | 라디안 x의 탄젠트를 구한다
math.pi | 원주율을 얻는다
math.e | 자연로그의 밑을 얻는다


In [11]:
import math

print(math.log(100))
print(math.log10(100))
print(math.sqrt(100))
print(math.sin(100))
print(math.pi)
print(math.e)

4.605170185988092
2.0
10.0
-0.5063656411097588
3.141592653589793
2.718281828459045


### 통계 계산

python 3.4부터 새로 추가된 `statistics` 기능을 가지고 평균값과 중간값을 구해 보겠습니다.

함수이름 | 설명
---|---
statistics.mean(data) | 데이터의 평균값을 구한다
statistics.median(data) | 데이터의 중앙값을 구한다
statistics.mode(data) | 데이터의 최빈값을 구한다
statistics.stdev(data) | 데이터의 표본편차를 구한다
statistics.variance(data) | 데이터의 표본분산으을 구한다

In [14]:
import statistics

data = [1,2,3,4,5,5,7,8,9,10]

print(statistics.mean(data))
print(statistics.median(data))
print(statistics.mode(data))
print(statistics.stdev(data))
print(statistics.variance(data))

5.4
5.0
5
3.025814858109391
9.155555555555555


<div id ="time" />
# 3. 날짜와 시간 처리하기

지금부터는 날짜와 시간을 다루는 기능을 제공하는 `datetime`에 대해서 알아 보겠습니다.


In [16]:
from datetime import date
date.today()

datetime.date(2018, 2, 4)

In [21]:
import time
time.gmtime()

time.struct_time(tm_year=2018, tm_mon=2, tm_mday=4, tm_hour=5, tm_min=0, tm_sec=25, tm_wday=6, tm_yday=35, tm_isdst=0)

In [22]:
time.time()

1517720437.0213869

# 4. 자료형과 알고리즘

`python`에는 내장형의 리스트나 사전,집합 등의 범용적인 자료구조가 있습니다. 목적에 맞는 자료구조와 알고리즘의 특징을 잘 이해해 두도록 합시다.

# 파일 경로 조작하기
`os.path`와 같은 파일 경로 조작을 객체지향 스타일로 제공하는 표준 라이브러리에 대해서 설명하겠습니다.

In [23]:
# 파일 경로 저작하기
import os.path
os.path.abspath('.')

'/home/jovyan/work'

In [25]:
os.path.join('home','jovyan','work')

'home/jovyan/work'

# 9. 인터넷상의 데이터 다루기
`http`를 자유자재로 다루는 것은 기본입니다. `urllib.parse`모듈은 **python 2**에서는 `urlparse`라는 독립된 모듈이었으나, **python 3**부터는 `urllib.parse`가 되었습니다.

In [26]:
from urllib import parse
result = parse.urlparse('https://www.google.co.kr')
result

ParseResult(scheme='https', netloc='www.google.co.kr', path='', params='', query='', fragment='')

In [27]:
print(result.geturl())
print(result.scheme)
print(result[0])
print(result.hostname)

https://www.google.co.kr
https
https
www.google.co.kr
