### 강의 소개

 

이번 강의에서는 프로그램을 제대로 만들기 위해 알아야 하는 **예외 처리**와 **파일 다루기**에 대해서 배웁니다.

대부분의 경우 우리가 만드는 프로그램에는 우리가 **예상치 못한 오류**가 생기곤 합니다. 이를 해결하기 위해서 사전에 모든 경우를 다 지정해서 대비하는 경우도 있지만, 특정 상황에서 발생할 수 있는 **예외**를 포괄적으로 지정해서 대비하는 경우도 있습니다. 또, 실제 프로그램을 작성할 때는 **파일에 존재하는 데이터**를 사용하는 경우가 많습니다.

추가적으로 여러가지 **프로그램을 진행하면서 기록**을 남기는 로깅에 대해서도 배웁니다. **로그 데이터**를 남기는 건 오늘날 데이터 기반의 애플리케이션 개발에서 매우 중요한 이슈가 되고 있습니다. **로그 데이터**를 설계하는 것이 하나의 분야로 자리잡고 있을 만큼 매우 관심을 받고 있습니다.

이번 장을 통해서 파이썬으로 데이터를 다루는 가장 기본적인 영역을 시작해보겠습니다.

## Exception
1. 예상 가능한 예외(if문)
- 발생 여부를 사전에 인지할 수 있는 예외
- 사용자의 잘못된 입력, 파일 호출 시 파일 없음
- 개발자가 반드시 명시적으로 정의 해야함
2. 예상이 불가능한 예외(Exception Handling)
- 인터프리터 과정에서 발생하는 예외, 개발자 실수
- 리스트의 범위를 넘어가는 값 호출, 정수 0으로 나눔
- 수행 불가시 인터프리터가 자동 호출

# Exception Handling
- try ~ except 문법<br>
```Python
try:
    예외 발생 가능 코드
except <Exception Type>:
    예외 발생시 대응하는 코드
```
- try ~ except ~ else 문법<br>
```Python
try:
    예외 발생 가능 코드
except <Exception Type>:
    예외 발생시 동작하는 코드
else:
    예외가 발생하지 않을 때 동작하는 코드
```
- try ~ except ~ finally 문법<br>
```Python
try:
    예외 발생 가능 코드
except <Exception Type>:
    예외 발생시 동작하는 코드
finally:
    예외 발생 여부와 상관없이 실행됨
```
- raise 구문: 필요에 따라 강제로 Exception을 발생
```Python
raise <Exception Type> (예외정보)
```
- assert 구문: 특정 조건에 만족하지 않을 경우 예외 발생
```Python
assert 예외조건
```

In [7]:
#try ~ except 문법
for i in range(10):
    try:
        print(10/i)
    except ZeroDivisionError:
        print("Not divided by 0")

Not divided by 0
10.0
5.0
3.3333333333333335
2.5
2.0
1.6666666666666667
1.4285714285714286
1.25
1.1111111111111112


In [10]:
#try ~ except ~ else 문법
for i in range(10):
    try:
        result = 10//i
    except ZeroDivisionError:
        print("Not divided by 0")
    else:
        print(10//i)

Not divided by 0
10
5
3
2
2
1
1
1
1


In [11]:
#try ~ except ~ finally 문법
try:
    for i in range(1, 10):
        result = 10//i
        print(result)
except ZeroDivisionError:
    print("Not divided by 0")
finally:
    print("종료되었습니다.")

10
5
3
2
2
1
1
1
1
종료되었습니다.


In [13]:
#raise 구문
while True:
    value = input("변환할 정수 값을 입력해주세요: ")
    for digit in value:
        if digit not in "0123456789":
            raise ValueError("숫자 값을 입력하지 않으셨습니다")
    print("정수값으로 변환된 숫자 -", int(value))

변환할 정수 값을 입력해주세요: 1
정수값으로 변환된 숫자 - 1
변환할 정수 값을 입력해주세요: 2
정수값으로 변환된 숫자 - 2
변환할 정수 값을 입력해주세요: 3
정수값으로 변환된 숫자 - 3
변환할 정수 값을 입력해주세요: a


ValueError: 숫자 값을 입력하지 않으셨습니다

In [16]:
#assert 구문
def get_binary_nmubmer(decimal_number : int):
    assert isinstance(decimal_number, int) #type이 int가 아닐 때 False를 해서 예외 발생
    return bin(decimal_number)
print(get_binary_nmubmer(10.0))

AssertionError: 

## exception의 종류
#### - Built-in Exception: 기본적으로 제공하는 예외

    IndexError -> List의 index 범위를 넘어갈 때

    NameError -> 존재하지 않은 변수를 호출할 때

    ZeroDivisonError -> 0으로 숫자를 나눌 때

    ValueError -> 변환할 수 없는 문자/숫자를 변환할 때

    FileNotFoundError -> 존재하지 않는 파일을 호출할 때


In [5]:
a = [1,2,3,4,5]
for i in range(10):
    try:
        print(i, 10 // i)
        print(a[i])
        print(v)
    except ZeroDivisionError:
        print("Error")
        print("Not divided by 0")
    except IndexError as e:
        print(e)
    except Exception as e: #모든 exception을 못 잡을 때...(권장하지 않음)
        print(e)

Error
Not divided by 0
1 10
2
name 'v' is not defined
2 5
3
name 'v' is not defined
3 3
4
name 'v' is not defined
4 2
5
name 'v' is not defined
5 2
list index out of range
6 1
list index out of range
7 1
list index out of range
8 1
list index out of range
9 1
list index out of range


# File Handling
File System, 파일 시스템: OS에서 파일을 저장하는 트리구조 저장 체계

File from wiki: 컴퓨터 등의 기기에서 의미 있는 정보를 담는 논리적인 단위, 모든 프로그램은 파일로 구성되어 있고, 파일을 사용한다.

## 파일과 디렉토리
- 파일의 기본체계: 파일 vs 디렉토리
### 디렉토리(Directory)
- 폴더 또는 디렉토리로 불림
- 파일과 다른 디렉토리를 포함할 수 있음
### 파일(File)
- 컴퓨터에서 정보를 저장하는 논리적인 단위
- 파일은 파일명과 확장자로 식별됨
- 실행, 쓰기, 읽기 등을 할 수 있음

## 파일의 종류
- 기본적은 파일 종류는 text, binary 파일로 나뉨
### Text파일
- 인간도 이해할 수 있는 형태인 문자열 형식으로 저장된 파일
- EX) HTML, Python code file
### binary 파일
- 컴퓨터만 이해할 수 있는 형태인 이진(법)형식으로 저장된 파일
- 일반적으로 메모장으로 열면 내용이 깨져보임
- EX) 엑셀파일, 워드 파일 등등

# Python File I/O
- 파이썬은 파일 처리를 위해 "open" 키워드를 사용함
```Python
f = open("<파일이름>", "접근모드")
f.close()
```

### 파일 열기 모드
- r: 읽기 모드 - 파일을 읽기만 사용할 때 사용
- w: 쓰기 모드 - 파일에 내용을 쓸 때 사용
- a: 추가 모드 - 파일의 마지막에 새로운 내용을 추가 시킬 때 사용

## File Read

In [None]:
#read() txt파일 안에 있는 내용을 문자열로 반환, 대상 파일이 같은 폴더에 있을 경우
f = open("i_have_a_dream.txt", "r")
contents = f.read()
print(contents)
f.close()

In [None]:
#with 구문과 함께 사용하기
with open("i_have_a_dream.txt", "r") as my_file:
    contents = my_file.read()
    print(type(contents), contents)

In [None]:
#한 줄씩 읽어 List Type으로 반환함
with open("i_have_a_dream.txt", "r") as my_file:
    content_list = my_file.readlines() #파일 전체를 list로 반환
    print(type(content_list)) #type 확인
    print(content_list) #리스트 값 출력

In [None]:
#실행 시 마다 한 줄 씩 읽어오기
with open("i_have_a_dream.txt", "r") as my_file:
    i = 0
    while True:
        line = my_file.readline()
        if not line:
            break
        print(str(i) + "===" + line.replace("\n", "")) #한줄씩 값 출력
        i = i+1

In [None]:
#단어 통계 정보 산출
with open("i_have_a_dream.txt", "r") as my_file:
    contents = my_file.read()
    word_list = contents.split(" ") #빈칸 기준으로 단어를 분리 리스트
    line_list = contents.split("\n") #한줄 씩 분리하여 리스트
print("Total Number of Characters : ", len(contents))
print("Total Number of Words:", len(word_list))
print("Total Number of Lines:", len(line_list))

## File Write

In [None]:
#mode는 "w", encoding="utf8"
f = open("count_log.txt", "w", encoding="utf8")
for i in range(1, 11):
    data = "%d번째 줄입니다.\n" % i
    f.write(data)
f.close()

In [None]:
#mode는 "a" 추가 모두
with open("count_log.txt", 'a', encoding="utf8") as f:
    for i in range(1, 11):
        data = "%d번째 줄입니다.\n" % i
        f.write(data)

## 파이썬의 directory 다루기

In [None]:
import os
os.mkdir("log")

In [None]:
#디렉토리가 있는지 확인하기
if not os.path.isdir("log"):
    os.mkdir("log")

In [17]:
#최근에는 pathlib 모듈을 사용하여 path를 객체로 다룸
import pathlib
cwd = pathlib.Path.cwd() #현재 디렉토리 위치 리턴
cwd.parent #현재 디렉토리의 부모 위치까지 리턴
list(cwd.parents) #리스트로 부모 위치들 list
list(cwd.glob("*")) #현재 폴더안의 모든 정보를 리턴

[WindowsPath('C:/Users/freet/Pre-Course_4th/Lectur_Basal-AI/2/.ipynb_checkpoints'),
 WindowsPath('C:/Users/freet/Pre-Course_4th/Lectur_Basal-AI/2/File, Exception, Log_Handling.ipynb'),
 WindowsPath('C:/Users/freet/Pre-Course_4th/Lectur_Basal-AI/2/module_and_project.ipynb')]

## Log 파일 생성하기

In [24]:
import os
if not os.path.isdir("log"):
    os.mkdir("log")

TARGET_FILE_PATH = os.path.join("log", "count_log.txt")
if not os.path.exists("TARGET_FILE_PATH"):
    f = open("log/count_log.txt", "w", encoding="utf8")
    f.write("기록이 시작됩니다\n")
    f.close()


In [38]:
with open("log/count_log.txt", "a", encoding="utf8") as f:
    import random, datetime
    for i in range(1, 11):
        stamp = str(datetime.datetime.now())
        value = random.random() * 1000000
        log_line = stamp + "\t" + str(value) +"값이 생성되었습니다." + "\n"
        f.write(log_line)

## Pickle
- 파이썬 객체를 영속화(persistence)하는 bulit-in 객체
- 데이터, object 등 실행 중 정보를 저장 -> 불러와서 사용
- 저장해야하는 정보, 계산 결과(모델) 등 활용이 많음

파이썬의 특화된 바이너리 파일

In [45]:
import pickle
f = open("list.pickle", "wb")
test = [1,2,3,4,5]
pickle.dump(test, f)
f.close()

In [46]:
del test

In [48]:
f = open("list.pickle", "rb")
test_pickle = pickle.load(f)
test_pickle

[1, 2, 3, 4, 5]

In [50]:
import pickle
class Mutltiply(object):
    def __init__(self, multiplier):
        self.multiplier = multiplier
    def multiply(self, number):
        return number * self.multiplier

In [52]:
muliply = Mutltiply(5)
muliply.multiply(100)

500

In [54]:
f = open("multiply_object.pickle", "wb")
pickle.dump(muliply, f)
f.close()

In [55]:
del muliply

In [56]:
muliply

NameError: name 'muliply' is not defined

In [58]:
f = open("multiply_object.pickle", "rb")
multiply_pickle = pickle.load(f)
multiply_pickle.multiply(100)

500

# Logging Handling
## 로그 남기기 - Logging
- 프로그램이 실행되는 동안 일어나는 정보를 기록을 남기기
- 유저의 접근, 프로그램의 Excepption, 특정 함수의 사용
- Console 화면에 출력, 파일에 남기기, DB에 남기기 등등
- 기록된 로그를 분석하여 의미있는 결과를 도출할 수 있음
- 실행시점에서 남겨야 하는 기록, 개발 시점에서 남겨야 하는 기록

### print vs logging 
- 기록을 print로 남기는 것도 가능하지만 console 창에만 남기면 분석시에 사용 불가능
- 때로는 레벨별(개발, 운영)로 기록을 남길 필요도 있음
- 모듈별로 별도의 logging을 남길 필요도 있음
- 이러한 기능을 체계적으로 지원하는 모듈이 필요함

## logging 모듈
- python의 기본 log 관리 모듈

In [61]:
import logging
#파이썬의 기본 레벨인 WARNING부터 나오기에 나머지는 안나옴
logging.debug("틀렸잖아")
logging.info("확인해")
logging.warning("조심해!")
logging.error("에러났어!")
logging.critical("망했다...") #프로그램이 정료되었을 떄

ERROR:root:에러났어!
CRITICAL:root:망했다...


## logging level
- 프로그램 진행 상황에 따라 다른 Level의 Log를 출력함
- 개발 시점, 운영 시점마다 다른 Log가 남을 수 있도록 지원함
- DEBUG > INFO > WARNING > ERROR < CRITICAL
- Log 관리시 가장 기본이 되는 설정 정보

**DEBUG: 개발시 처리 기록을 남겨야하는 로그 정보를 남김**<br>
예시) 다음 함수로 A를 호출함<br>
예시) 변수 A를 무엇으로 변경함

**INFO: 처리가 진행되는 동안의 정보를 알림**<br>
예시) 서버가 시작되었음, 서버가 종료되었음<br>
예시) 사용자 A가 프로그램에 접속함

**WARNING: 사용자가 잘못 입력한 정보나 처리는 가능하나 원래 개발시 의도치 않는 정보가 들어왔을 때 알림**<br>
예시) Str 입력을 기대했으나, int가 입력됨 -> Str casting으로 처리함<br>
예시) 함수에 argument로 이차원 리스트를 기대했으나 -> 일차원 리스트가 들어옴, 이차원으로 변환 후 사용

**ERROR: 잘못된 처리로 인해 에러가 났으나, 프로그램은 동작할 수 있음을 알림**<br>
예시) 파일에 기록을 해야하는데 파일이 없음 -> Exception 처리 후 사용자에게 알림
예시) 외부 서비스와 연결 불가

**CRITICAL: 잘못된 처리로 데이터 손실이나 더이상 프로그램이 동작할 수 없음을 알림**<br>
예시) 잘못된 접근으로 해당 파일이 삭제됨<br>
예시) 사용자의 의한 강제 종료

In [88]:
import logging
if __name__ == '__main__':
    logger = logging.getLogger("main")
    logging.basicConfig(level = logging.DEBUG)
    
    logger.setLevel(logging.INFO)
    
    
    #log 출력 어디에 할지
    steam_handler = logging.FileHandler(
        "my.log", mode ="w", encoding = "utf8")
    
    logger.addHandler(steam_handler)
    

    logger.debug("틀렸잖아")
    logger.info("확인해")
    logger.warning("조심해!")
    logger.error("에러났어!")
    logger.critical("망했다...") #프로그램이 정료되었을 떄

INFO:main:확인해
ERROR:main:에러났어!
CRITICAL:main:망했다...


### logging은 log 파일이나 level등 세팅을 해야하는 것이 많음(데이터 파일 위치, 파일 저장 장소, Operation Type 등
### 사전에 세팅하는 방법
1) configparser - 파일에<br>
2) argparser - 실행 시점에

### Configparser
- 프로그램의 실행 설정을 file에 저장함
- Section, Key, Value 값의 형태로 설정된 설정 파일을 사용
- 설정파일을 Dict Type으로 호출 후 사용

#### Config file : example.cfg 내용
[Section One]

Status: Single

Name: Derek

Value: YES

Age: 30

Single: True

[SectionTwo]

FavoriteColor = Green

[SectionThree]

FamilyName: Johnson

In [102]:
import configparser
config = configparser.ConfigParser()

config.read("example.cfg")
print(config.sections())

for key in config['SectionOne']:
    value = config['SectionOne'][key]
    print("{0} : {1}". format(key, value))

['SectionOne', 'SectionTwo', 'SectionThree']
status : Single
name : Derek
value : YES
age : 30
single : True


### Argparser
- Console 창에서 프로그램 실행 시 Setting 정보를 저장함
- 거의 모든 Console 기반 Python 프로그램 기본으로 제공
- 특수 모듈도 많이 존재하지만(TF), 일반적으로 argparse를 사용
- Command-Line Option이라고 부름

https://github.com/abseil/abseil-py 

#agr_sum.py
```Python
import argparse

parser = argparse.ArgumentParser(
    description = 'Sum two integers.')

parser.add_argument(
    '-a', "--a_value",
    dest="a", help="A integers", type=int,
    required=True)

parser.add_argument(
    '-b', "--b_balue",
    dest="b", help="B integers", type=int,
    required=True)

args = parser.parse_args()
print(args)
print(args.a)
print(args.b)
print(args.a + args.b)
```

**python arg_sum.py**

라고 실행하면 help를 띄움

**python arg_sum.py -a 10 -b 10**

Namespace(a=10, b=10)

10

10

20


## Logging 적용하기
### Logging formmater
- Log의 결과값을 format을 지정할 수 있음
```Python
for matter = logging.Formatter('%(asctime)s %(levelname)s %(process)d %(message)s')
```

### Log config file
- 어떤 형태의 config를 쓸지 선택
```Python
logging.config.fileConfig('logging.conf')
logger = logging.getLogger()
```