In [5]:
# bytes, str, unicode의 차이점

# bytes 인스턴스 == 8bit 값을 저장한다
# str 인스턴스 == 유니코드 문자열 저장

# python3의 str 인스턴스는 연관된 바이너리 인코딩이 없음
# 그래서 str => bytes 변환을 위해서는 encode 함수를 사용해야 함
# 반대로 bytes => str 변환을 위해서는 decode 함수를 사용해야 함

# 문자 타입이 분리되어 있기에 파이썬 코드에서는 2가지 상황에 직면함
# 1. UTF-8(혹은 다른 인코딩)으로 인코드된 문자 raw 8bit 값을 처리해야하는 상황
# 2. 인코딩이 없는 유니코드 문자를 처리해야하는 상황

# 두 경우 사이에서 변환하고 코드에서 원하는 타입과 입력값의 타입이 정확히 일치하게 하려면 2개의 헬퍼함수가 필요함

## str or bytes를 입력받고 str로 반환하는 함수
def to_str(bytes_or_str):
    if isinstance(bytes_or_str, bytes):
        value = bytes_or_str.decode('utf-8')
    else:
        value = bytes_or_str
    return value # str 인스턴스

## str or bytes를 입력받고 bytes로 반환하는 함수
def to_bytes(bytes_or_str):
    if isinstance(bytes_or_str, str):
        value = bytes_or_str.encode('utf-8')
    else:
        value = bytes_or_str
    return value # bytes 인스턴스

In [8]:
type(to_str('Jade han'))

str

In [9]:
type(to_bytes('Jade han'))

bytes

In [12]:
import os
# 파이썬 3에서 내장함수 open이 반환하는 파일 핸들을 사용하는 연산은 기본으로 UTF-8인코딩을 사용
# 파이썬 3에서 open 함수에 encoding 인수가 추가되었기 때문에 read, write 연산은 기본적으로 str 인스턴스를 요구한다
with open('/tmp/bandom.bin', 'w') as f:
    f.write(os.urandom(10))

TypeError: write() argument must be str, not bytes

In [17]:
# 이를 해결하기 위해서는 단순한 'w' 모드가 아니라 'wb'(write binary) 모드를 사용해야 한다.
# 읽기 모드 'r' 도 마찬가지로 'rb' 모드를 사용해야 한다.
with open('/tmp/ramdom.bin', 'wb') as f:
    f.write(os.urandom(10))