## 07-1 파이썬과 유니코드

### 인코딩

In [None]:
# 파이썬에서 사용하는 문자열은 모두 유니코드 문자열이다. (파이썬 3 버전부터 모든 문자열을 
# 유니코드로 처리하도록 변경되었다.)

# 유니코드 문자열은 인코딩(encoding) 없이 그대로 파일에 적거나 다른 시스템으로 전송할 수 없다. 
# 왜냐하면 유니코드 문자열은 단순히 문자셋의 규칙이기 때문이다. 파일에 적거나 다른 시스템으로 
# 전송하려면 바이트로 변환해야 한다. 이렇게 유니코드 문자열을 바이트로 바꾸는 것을 인코딩이라 
# 한다. 따라서 파일을 읽거나 네트워크를 통해 바이트 문자열을 수신할 때에는 해당 바이트가 어떤 
# 방식의 인코딩을 사용했는지를 미리 알아야만 디코딩할 수 있다.
# -------------------------------------------------------------------------------------------

In [5]:
# 유니코드를 바이트 문자열로 변경
# ------------------------------
a = 'Life is too short'
b = a.encode('utf-8')

print(b)
type(b)

b'Life is too short'


bytes

In [None]:
# 유니코드 문자열을 바이트 문자열로 만들 때에는 이 예처럼 utf-8과 같은 인코딩 방식을 인수로 
# 넘겨 주어야 한다. 인수를 생략하면 기본값인 utf-8로 동작한다. 문자열을 변환하고 나서 type
# 명령어를 호출해 보면 b 객체는 bytes 클래스의 객체임을 알 수 있다.
# -----------------------------------------------------------------------------------------

In [6]:
a = '한글'
a.encode('ascii')

# 위 예에서는 한글이라는 유니코드 문자열을 아스키(ascii) 방식으로 인코딩하려고 시도한다. 
# 하지만, 아스키 방식으로는 한글을 표현할 수 없으므로 오류가 발생

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

In [9]:
# "한글"이라는 유니코드 문자열을 바이트로 변경하는 인코딩 방식에는 여러 개가 있다. 
# 보통은 utf-8을 사용하지만, 기존 시스템이 euc-kr과 같은 옛날 방식의 인코딩을 사용
# 한다면 다음과 같이 euc-kr로 인코딩할 수도 있다.
# -------------------------------------------------------------------------------
a = '한글'
print(a.encode('euc-kr'))
print(a.encode('utf-8'))


b'\xc7\xd1\xb1\xdb'
b'\xed\x95\x9c\xea\xb8\x80'


### 디코딩

In [11]:
# 인코딩한 바이트 문자열을 유니코드 문자열로 변환하는 디코딩(decoding)
# -------------------------------------------------------------------
a = '한글'
b = a.encode('euc-kr')
b.decode('euc-kr')

# b.decode('utf-8')     # 에러 발생

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc7 in position 0: invalid continuation byte

### 입출력과 인코딩

In [None]:
# 파일을 읽거나 네트워크를 통해 데이터를 주고받을 때 추천하는 방법은 다음과 같다.
# ------------------------------------------------------------------------------
# 1. 입력으로 받은 바이트 문자열은 가능한 한 가장 빨리 유니코드 문자열로 디코딩할 것
# 2. 유니코드 문자열만 함수나 클래스 등에서 사용할 것
# 3. 입력에 대한 결과를 전송하는 마지막 부분에서만 유니코드 문자열을 바이트 문자열로 인코딩해서 반환할 것
# ------------------------------------------------------------------------------------------------------
# --- file(utf-8, euc-kr)  -> read 변수(유니코드) -> 파일 write(utf-8, euc-kr) 
#
# 1. euc-kr로 작성된 파일 읽기
# ----------------------------
with open('euc_kr.txt', encodeing='euc-kr') as f:
    data = f.read()     # 유니코드 문자열

# 2. unicode 문자열로 프로그램 수행하기
# -------------------------------------
data = data + '\n' + '추가 문자열'

# 3. euc-kr로 수정된 문자열 저장하기
# ---------------------------------
with open('euc-kr.txt', encoding='euc-kr', mode='w') as f:
    f.write(data)

### 소스코드의 인코딩

In [None]:
# 파이썬 셸이 아닌 편집기로 코딩할 때는 소스 코드의 인코딩이 매우 중요하다. 
# 소스 코드의 인코딩이란 소스 코드 파일이 현재 어떤 방식으로 인코딩되었지를 뜻한다.

# 소스 코드도 파일이므로 인코딩 타입이 반드시 필요하다. 파이썬은 소스 코드의 인코딩을 
# 명시하고자 소스 코드 가장 위에 다음과 같은 문장을 넣어야 한다.
# # -*- coding: utf-8 -*-
# # -*- coding: euc-kr -*-

## 07-2 클로저와 데코레이터

### 클로저

In [None]:
# 클로저
# ------
# 클로저는 간단히 말해 함수 안에 내부 함수(inner function)를 구현하고 그 내부 함수를 리턴하는 함수를 말한다. 
# 이때 외부 함수는 자신이 가진 변숫값 등을 내부 함수에 전달할수 있다. 알쏭달쏭한 설명이지만 예제를 보면 쉽게 이해할 수 있다.

In [15]:
def mul3(n):
    return n*3

def mul5(n):
    return n*5

# 이렇게 필요할 때마다 mul6(), mul7(), mul8(), …과 같은 함수를 만드는 것은 굉장히 비효율적이다. 
# 이 문제를 효율적으로 해결하려면 다음과 같이 클래스를 사용할수 있다.

class Mul:
    def __init__(self, m):
        self.m = m
    
    def mul(self, n):
        return self.m * n

if __name__ == '__main__':
    mul3 = Mul(3)
    mul5 = Mul(5)    
    
    print(mul3.mul(10))
    print(mul5.mul(10))

# 클래스를 이용하면 이 코드처럼 특정 값을 미리 설정하고 그다음부터 mul() 메서드를 사용하면 
# 원하는 형태로 호출할 수 있다. 그리고 다시 다음과 같이 __call__ 메서드를 이용하여 이를 개선할 수 있다.

class Mul1:
    def __init__(self, m):
        self.m = m
    
    def __call__(self, n):
        return self.m * n

if __name__ == '__main__':
    mul3 = Mul1(3)
    mul5 = Mul1(5)    
    
    print(mul3(10))
    print(mul5(10))

# mul() 함수 이름을 __call__로 바꾸었다. 
# __call__ 함수는 Mul 클래스로 만든 객체에 인수를 전달하여 바로 호출할 수 있도록 하는 메서드이다. 
# __call__ 메서드를 이용하면 이 예제처럼 mul3 객체를 mul3(10)처럼 호출할 수 있다. 
# 이렇게 클래스로 만드는 방법이 일반적이긴 하지만, 더 간편한 방법이 있다. 다음 함수를 보자.

def mul(m):
    def wrapper(n):
        return m*n
    return wrapper

if __name__ == '__main__':
    mul3 = mul(3)
    mul5 = mul(5)
    
    print(mul3(10))
    print(mul5(10))
    
# 외부 함수(mul()) 안에 내부 함수(wrapper())를 구현했다. 
# 그리고 외부 함수는 내부 함수 wrapper()를 리턴한다. 
# 함수가 함수를 리턴하는 것이 생소할 수 있겠지만 파이썬에서는 이것이 가능하다.

# 재밌는 사실은 mul() 함수에서 wrapper() 함수를 리턴할 때 mul() 함수 호출 시 인수로 
# 받은 m값을 wrapper() 함수에 저장하여 리턴한다는 점이다. 이것은 마치 클래스가 특정한 
# 값을 설정하여 객체를 만드는 과정과 매우 비슷하다. 
# 이러한 mul()과 같은 함수를 파이썬에서는 클로저(Closure)라 한다.    

30
50
30
50
30
50
