![Python](assets/python-logo-generic.svg)
### Exception & IO
#### 김응섭

## Outline
* Exception
* IO
* Serialization

## Exception
* Exception
* try/except/finally

## Exception
* 프로그램 수행 중에 발생하는 예외사항/오류를 의미
* Exception object를 통해 이 정보를 주고 받음
* Exception 발생하면 제어 흐름이 변함
  * 기본 동작으로 traceback 출력
  * Exception을 통해 제어 흐름을 바꾸기도 함

## Exception hierarchy
* BaseException
    * Exception
        * StopIteration
        * ArithmeticError
        * LookupError
        * NameError
        * OSError
        * ValueError
        * ...

## ArithmeticError
* ZeroDivisionError: 0으로 나누면 발생

In [1]:
3/0

ZeroDivisionError: division by zero

## LookupError
* IndexError: 없는 index에 접근할 때
* KeyError: 없는 key에 접근할 때

In [3]:
l = []
d = {}
l[2]            # IndexError

IndexError: list index out of range

In [4]:
d['python']     # KeyError

KeyError: 'python'

## 참고: help()
* help(symbol): built-in function
    * 도움말을 출력
    * argument, docstring 등을 보여줌

In [5]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



## NameError
* NameError: 없는 symbol에 접근할 때

In [6]:
help(chain)

NameError: name 'chain' is not defined

## 참고: int()
* int(s, base=10)
    * str으로 표현된 숫자를 int로 변환
    * base=0이면 hex, dec, oct 구분하여 변환

In [7]:
print(int('12'))
print(int('0xc', base=0))

12
12


## try/except/finally
* try: exception 발생 가능한 코드 블럭을 지정
* except: exception이 발생했을 때 정리를 위한 코드 블럭 지정 (복수 지정 가능)
* finally: exception 발생 여부와 상관 없이 실행해야 할 코드 지정 (optional)
    * try에서 획득한 resource나 lock의 해제를 수행하는 코드가 여기에 위치해야 함

## try/except/finally

```python
try:
    <code block>
except [<exception_type> [as <exception_var>]:
    <code block>
[finally:
    <code block>]
```

## try example
* raise: exception을 일으키는 statement
    * except 절에서 object 없이 사용하면 except가 받은 exception을 try/except 밖으로 전달

In [8]:
def div(x, y):
    try:
        return x/y
    except ZeroDivisionError as e:
        print(e)
        raise

print(div(2, 0))

division by zero


ZeroDivisionError: division by zero

## try example
* Exception을 처리하고 try/except 밖으로 전달하지 않는 경우

In [9]:
def div(x, y):
    try:
        result = x/y
    except ZeroDivisionError:
        result = 0
    return result

print(div(2, 0))

0


## try example
* 여러 except 절이 있는 경우
    * exception 종류에 따라 처리를 달리 해야 하는 경우
    * 정의된 순서대로 match 수행

In [10]:
def div(x, y):
    try:
        result = x/y
    except ZeroDivisionError:
        result = 0
    except Exception as e:
        result = None
    return result

print(div(2, 0))
print(div('x', 1))

0
None


## IO
* open
* with
* write / read
* StringIO

## open
* open(file_path, mode='r')
    * file을 열고 file obj를 돌려줌
* mode
    * 'r': read mode
    * 'w': write mode
    * 'a': append mode
    * 'b': binary mode

## with
* with: context manager
    * code block에 들어올 때, resource를 할당
    * code block에서 나갈 때, resource 해제

```python
with <create> as <resource>:
    <code block>
```

## with
* IO operation을 with 내부에서 하면, resource 할당/해제를 편하고 명시적으로 수행할 수 있다

In [11]:
with open('some.txt', 'w') as f:    # 'some.txt'를 생성하여 f에 할당
    ...                             # f를 가지고 operation 수행
# with를 빠져 나오면 f는 닫힌 상태가 된다.
assert f.closed        

## write
* f.write(str): file에 str을 쓰고, 기록된 character 수를 리턴
* str(obj): obj의 string 표현

In [13]:
l = ['apple', 'orange', 'banana']
with open('some.txt', 'w') as f:
    for i in range(2):
        n = f.write(str(l))
print(n)

29


['apple', 'orange', 'banana']['apple', 'orange', 'banana']

## print to file
* print(value, ..., end=' ', file=sys.stdout)
    * file 지정을 바꾸면 그 파일로 formatted string 출력

In [15]:
l = ['apple', 'orange', 'banana']
with open('some.txt', 'w') as f:
    for e in l:
        print(e, file=f)

apple  
orange  
banana

## read
* read(size=-1)
    * read at most n characters from stream
    * -1: EOF(end-of-file)까지 읽음 (버퍼 크기에 주의)

In [16]:
with open('some.txt') as f:
    read_data = f.read()    # File 전체를 읽음
print(read_data)

apple
orange
banana



## readlines
* readline(): return a list of lines from the stream

In [17]:
with open('some.txt') as f:
    lines = f.readlines()    # File 전체를 읽음
print(lines)
for line in lines:
    print(line, end='')

['apple\n', 'orange\n', 'banana\n']
apple
orange
banana


## line-by-line operation
* file_obj이 iterable하며, 원소로 line을 돌려준다
    * line의 끝에는 '\n' 존재
    * 마지막 line은 '\n'을 갖고 있지 않을 수 있다 
* File 전체를 읽는 것보다 효율적

In [18]:
with open('some.txt') as f:
    for line in f:
        print(line, end='')

apple
orange
banana


## StringIO
* file은 character(t)/byte stream(b)으로 정의됨
* string도 이 특성을 만족하므로 file처럼 쓸 수 있다
* StringIO를 open 대신에 사용

In [20]:
from io import StringIO

test_str = """1st line
2nd line"""

f = StringIO(test_str)
for line in f:
    print(line, end='')

1st line
2nd line

## Serialization
* 소개
* pickle
* JSON

## Terms in context
* Process
    * Program이 실행되어 있는 상태
* State
    * Memory에 저장되어 있는 내용
* File 
    * A stream of character / byte

## Serialization
> Process of translating data structures or object state into a format that can be stored (for example, in a file or memory buffer) or transmitted (for example, across a network connection link) and reconstructed later (possibly in a different computer environment)

_(from wikipedia)_

## Serialization
* Object를 file에 저장하거나 전송하기 위해서 character / byte stream으로 만드는 일
* 반대의 경우는 de-serialization으로 부른다
* Data persistence (영속성)
    * Process가 죽으면 object도 사라지지만, serialize 및 저장된 데이터는 계속 살아 남을 수 있다

## Serialization library
* Serialize 방식에 따라 여러 라이브러리 존재
    * Binary format: pickle
    * Human readable format: XML, YAML, JSON
    * Database: sqlite3
* 인터페이스는 거의 동일함

## Pickle
* Python standard library에 존재
* 현재 버전은 binary format
* 장점: Binary format이므로 text format보다 크기가 작다
* 단점
    * Binary format이므로 저장된 데이터를 사람이 보기 어렵다
    * Python 전용 포멧이기 때문에 다른 언어로 만들어진 프로그램과 통신하기 어렵다

## Pickle example
* Object

In [21]:
from pickle import dump, load
class SomeType:
    def __init__(self, a):
        self.a = a
    def __repr__(self):
        return 'SomeType({})'.format(self.a)

x = SomeType(4)
print(x)
with open('x.pickle', 'wb') as f:   # Binary file
    dump(x, f)

with open('x.pickle', 'rb') as f:
    ax = load(f)
print(ax)

SomeType(4)
SomeType(4)


## Pickle example
* list and dict

In [22]:
from pickle import dump, load
l = ['a', 'b', 'c']
d = {'A': 0, 'B': 1, 'C': 2}

with open('ld.pickle', 'wb') as f:
    dump(l, f)
    dump(d, f)

with open('ld.pickle', 'rb') as f:
    al = load(f)
    ad = load(f)
print(al, ad)

['a', 'b', 'c'] {'A': 0, 'C': 2, 'B': 1}


## Pickle
* file이 아닌 string 사용: dumps, loads
    * 끝에 s가 붙어 있는 것에 주의

In [24]:
from pickle import dumps, loads

l = ['a', 'b', 'c']
l_str = dumps(l)
print(l_str)
al = loads(l_str)
print(al)

b'\x80\x03]q\x00(X\x01\x00\x00\x00aq\x01X\x01\x00\x00\x00bq\x02X\x01\x00\x00\x00cq\x03e.'
['a', 'b', 'c']


## json
* JSON: JavaScript Object Notation
* 비동기 브라우저-서버 통신 (AJAX)을 위해, XML을 대체하는 주요 표준 데이터 포맷 (RFC 7159, ECMA-404)
* 장점: 인간이 읽을 수 있는 텍스트 포멧
* 단점
    * Binary format보다는 크기가 크다
    * Comment는 지원하지 않는다
    * Object를 dump하기 위해서는 추가적인 일이 필요하다

## json data type
* Number: 7, 12, -2, 3.14, 5.67E+10
* String: ""로 둘러싸인 문자열 (''는 허용 안 됨)
* Array: []로 둘러싸인 comma-separated elements
* Object: {}로 둘러싸인 key: value 쌍들로 정의
* Boolean: true, false
* null: 빈 object

## json example

```json
{
    "이름": "테스트",
    "나이": 25,
    "특기": ["농구", "도술"],
    "가족관계": {"아버지": "홍판서", "어머니": "춘섬"},
}
```

```json
[
    {"name": "Jay", "age": 30},
    {"name": "Rucy", "age":35}
]
```

## json example
* list and dict

In [26]:
from json import dump, load

l = ['a', 'b', 'c']
d = {'A': 0, 'B': 1, 'C': 2}

with open('ld.json', 'w') as f: # Text file
    dump((l, d), f)

with open('ld.json') as f:
    al, ad = load(f)
print(al, ad)

['a', 'b', 'c'] {'A': 0, 'C': 2, 'B': 1}


## json example
* file이 아닌 string 사용

In [27]:
from json import dumps, loads

l = ['a', 'b', 'c']
l_str = dumps(l)
print(l_str)
al = loads(l_str)
print(al)

["a", "b", "c"]
['a', 'b', 'c']


## json example
* Pretty format

In [28]:
from json import dumps, loads

l = ['a', {'red': 0xff0000, 'green': 0x00ff00, 'blue': 0x0000ff}]
l_str = dumps(l, indent=4)
print(l_str)

[
    "a",
    {
        "red": 16711680,
        "green": 65280,
        "blue": 255
    }
]


## json obj dump
* Object: str, list, dict 등으로 변환 후 dump
    * 사용자가 직접 변환
    * default() 함수를 통해 JSON serializable object로 변환
    * Override the JSONEncoder.default()

## json obj dump
* Object is not JSON serializable

In [29]:
from json import dump, load # The same interface as pickle

class SomeType:
    def __init__(self, a):
        self.a = a
    def __repr__(self):
        return 'SomeType({})'.format(self.a)

x = SomeType(4)
print(x)
with open('x.json', 'w') as f:
    dump(x, f)         # x is not JSON serializable

SomeType(4)


TypeError: SomeType(4) is not JSON serializable

## json obj dump
* Object -> dict

In [30]:
from json import dump, load # The same interface as pickle

class SomeType:
    def __init__(self, a):
        self.a = a
    def __repr__(self):
        return 'SomeType({})'.format(self.a)

x = SomeType(4)
print(x)
with open('x.json', 'w') as f:   # Text file
    dump(x.__dict__, f)

with open('x.json') as f:
    ax = SomeType(**load(f))
print(ax)

SomeType(4)
SomeType(4)


## json obj dump
* Object -default-> dict

In [31]:
from json import dump, load, JSONEncoder

class SomeType:
    def __init__(self, a):
        self.a = a
    def __repr__(self):
        return 'SomeType({})'.format(self.a)

def default(obj):
    if isinstance(obj, SomeType):
        return obj.__dict__
    else:
        return obj

x = SomeType(4)
print(x)
with open('x.json', 'w') as f:
    dump(x, f, default=default) # passing default

with open('x.json') as f:
    ax = SomeType(**load(f))
print(ax)

SomeType(4)
SomeType(4)


## TODO
* list.index()에서 찾는 원소가 없을 때, 빈 str을 리턴하게 하는 예제 추가
* Wrap-up 페이지 작성