## 학습 목표
프로그램을 제대로 만들기 위해 알아야하는 3가지 정리
1. 예외 처리(Exception)
2. 파일에 존재하는 데이터 읽고 쓰기(File)
3. 프로그램을 진행하면서 기록을 남기는 로깅(Log)

## 예외 처리(Exception)
1. 예상 가능한 예외
    - 사전에 인지할 수 있는 예외 -> 명시적으로 정의해야 한다.<br>
    ex) 사용자의 잘못된 입력
    - python에선 exception을 발생시키고, exception handling으로 처리.
    
2. 예상이 불가능한 예외
    - 인터프리터 과정에서 발생하는 예외 (고려하지 못한 경우로인해 발생) -> 인터프리터가 자동으로 에러메시지호출<br>
    ex) 정수 0으로 나눔. 오타

### 예외처리 문법
- try ~ except 문법 사용
- try ~ except ~ else ~ finaaly로 쓸 수도 있음

In [3]:
for i in range(5):
    print(f"10을 {i}로 나누면 ",end=' ')
    try:
        print(10/i)
    except ZeroDivisionError:
        print("0으로 나누면 무한대!")

10을 0로 나누면  0으로 나누면 무한대!
10을 1로 나누면  10.0
10을 2로 나누면  5.0
10을 3로 나누면  3.3333333333333335
10을 4로 나누면  2.5


### Built-in Exception
파이썬에서 기본적으로 제공하는 예외
1. IndexError : List의 인덱스 범위 넘어갈 때
2. NameError : 존재하지 않는 변수 호출
3. ZeroDivisionError : 0으로 수를 나눌때
4. ValueError : 변환할 수 없는 문자/숫자를 변환할 때
5. FileNotFoundError : 존재하지 않는 파일 호출시

### raise 구문
- 강제로 Exception을 발생
```python
raise <Exception Type>(예외정보)
(ex) raise ValueError("값이 없다!")
```

### assert 구문
- 논리가 False로 나오면 예외 발생
```python
assert 예외 조건
assert a==b # a와 b가 다르면 예외 발생
```

## File Handling
- 파일은 기본적으로 text파일과 binary 파일로 나뉜다.
- 파이썬에선 파일 처리를 위해 "open" 키워드를 사용한다.

### os module
- os 모듈을 사용하여 Directory를 다룰 수 있다.<br>
Ex)
```python
import os
os.mkdir("log") # log 디렉토리 생성
```

#### 디렉토리 생성

In [2]:
import os
os.mkdir("log")

In [3]:
try:
    os.mkdir("log")
except:
    print("Already created")

Already created


#### 파일 or 디렉토리 존재 확인

In [6]:
# 파일 or 폴더가 이미 존재하는지 확인
os.path.exists("log")

True

In [9]:
# 폴더말고 파일이 존재하는지 확인
os.path.isfile("file.ipynb")

True

### shutil module - 파일 복사

In [11]:
import shutil

source= "README.md"
# os.path.join쓰는 이유: 파일 경로를 합칠 때 seperator가 OS마다 다르다. 
# 윈도우:₩₩, Mac, Linux:/, 등등
dest = os.path.join("log","test.txt")
dest

'log/test.txt'

In [12]:
## shutil - 파일 복사
shutil.copy(source,dest)

'log/test.txt'

In [13]:
!ls log

test.txt


### pathlib - path를 객체로 다룸

In [4]:
import pathlib
cwd = pathlib.Path.cwd()
cwd

PosixPath('/Users/cwj/ToyProject/00_data_analysis/00_BoostCamp/week1_python')

In [6]:
# 바로 슬래쉬를 쓸 수 있다.
cwd / "adsf"

PosixPath('/Users/cwj/ToyProject/00_data_analysis/00_BoostCamp/week1_python/adsf')

In [14]:
# 현재 디렉토리 내용 보기
list(cwd.glob("*1*"))

[PosixPath('/Users/cwj/ToyProject/00_data_analysis/00_BoostCamp/week1_python/4_1_Python_OOP.ipynb'),
 PosixPath('/Users/cwj/ToyProject/00_data_analysis/00_BoostCamp/week1_python/3_1_Python_Data_Structure.ipynb'),
 PosixPath('/Users/cwj/ToyProject/00_data_analysis/00_BoostCamp/week1_python/5_1_File&Exception&Log.ipynb'),
 PosixPath('/Users/cwj/ToyProject/00_data_analysis/00_BoostCamp/week1_python/2_1_Variables.ipynb')]

In [20]:
# Path가 객체기 때문에 parent, parent의 parent 이런식으로 편하게 접근 가능
print(cwd.parent)
print(cwd.parent.parent)

/Users/cwj/ToyProject/00_data_analysis/boostcourse
/Users/cwj/ToyProject/00_data_analysis


In [23]:
# 모든 부모 경로도 가능
list(cwd.parents)

[PosixPath('/Users/cwj/ToyProject/00_data_analysis/boostcourse'),
 PosixPath('/Users/cwj/ToyProject/00_data_analysis'),
 PosixPath('/Users/cwj/ToyProject'),
 PosixPath('/Users/cwj'),
 PosixPath('/Users'),
 PosixPath('/')]

### Pickle
- 파이썬의 객체를 파일로 저장하게 해주는 built-in 객체
- 데이터, object등 실행중 정보를 저장 -> 불러와서 사용 가능
- 저장해야하는 정보, 모델 등 활용이 많음

#### list 다루기

In [1]:
import pickle

li=[0,1,2,3,4,5]
## pickle은 python에 특화된 binary 파일이다.
with open("list.pickle","wb") as f:
    pickle.dump(li, f) # 위에서 생성한 리스트를 list.pickle로 저장    

with open("list.pickle","rb") as fi:
    test = pickle.load(fi) # list.pickle 읽어서 출력 -> list 잘 불러와졌다.

In [90]:
# pickle로 불러온 test의 type과 값 출력
print(type(test))
print(test)

<class 'list'>
[0, 1, 2, 3, 4, 5]


#### 데이터프레임 다루기

In [7]:
import pandas as pd
df = pd.DataFrame({'A':[0,1],'B':[2,3]})
df

Unnamed: 0,A,B
0,0,2
1,1,3


In [10]:
## pickle은 python에 특화된 binary 파일이다.
with open("df.pickle","wb") as f:
    pickle.dump(df, f) # 위에서 생성한 데이터 프레임을 df.pickle로 저장    

with open("df.pickle","rb") as fi:
    test = pickle.load(fi) # df.pickle 읽기
# 출력해보면 pandas의 데이터프레임이 그대로 잘 출력됨.
print(type(test))
test

<class 'pandas.core.frame.DataFrame'>


Unnamed: 0,A,B
0,0,2
1,1,3


#### 함수 다루기

In [14]:
import numpy as np
print(np.array)

<built-in function array>


In [15]:
with open("array.pickle","wb") as f:
    pickle.dump(np.array, f)
with open("array.pickle","rb") as fi:
    arr = pickle.load(fi)

k = arr(list(range(10)))
print(type(k))
print(k)

<class 'numpy.ndarray'>
[0 1 2 3 4 5 6 7 8 9]


#### 클래스 다루기

In [16]:
# 클래스 내부에 multiplier 값을 저장
# 이후에 multiply 메소드에 들어오는 값을 multiplier와 곱해서 반환
class Multiply(object):
    def __init__(self, multiplier):
        self.multiplier = multiplier
        
    def multiply(self, num):
        return num * self.multiplier

mply = Multiply(3) # multiplier를 3으로 지정
mply.multiply(3) # multiplier * 3 반환 => 9

9

In [96]:
with open("mply_object.pickle","wb") as f:
    pickle.dump(mply, f)

with open("mply_object.pickle","rb") as fi:
    mply_pickle = pickle.load(fi)    

print(type(mply_pickle))
mply_pickle.multiply(10)

<class '__main__.Multiply'>


30

## Logging
프로그램이 실행되는 동안의 정보를 남기는 것
- 남기는 내용: 유저의 행동, Exception 
- 어디에 남기는지: Console, 파일, DB
- 로그를 분석하여 의미있는 결과를 도출할 수 있다.
- 실행 시점에 남겨야하는 기록, 개발시점에 남겨야하는 기록이 있다

In [24]:
import logging
logging.critical("크~리티컬! 힛트!")

CRITICAL:root:크~리티컬! 힛트!


### Logging level
- DEBUG > INFO > WARNIGN > ERROR > Critical
- 시점에 따라 다른 log가 남을 수 있도록 지원

In [49]:
import logging

if __name__=='__main__':
    logger = logging.getLogger("main")
    # default 레벨은 warning부터
    # level을 Debug로 바꿔서 모든 로깅 다 나오게 설정
    logging.basicConfig(level=logging.DEBUG) 
    
    logger.debug("디버그")
    logger.info("인포")
    logger.warning("워닝")
    logger.error("에뤄")
    logger.critical("크뤼티칼!")

ERROR:main:에뤄
CRITICAL:main:크뤼티칼!


In [45]:
import logging
logger = logging.getLogger("mylogger") # Logger 선언
stream_handler = logging.StreamHandler() # Logger의 output 방법 선언
logger.addHandler(stream_handler) # Logger의 output 등록

logging.basicConfig(level=logging.DEBUG) # python 3.8 이후의 레벨 설정
# logger.setLevel(logging.DEBUG) # 레벨 설정

In [46]:
logger.debug("디~버그!")

디~버그!
DEBUG:mylogger:디~버그!


In [47]:
logger.handlers # 핸들러 종류 보기

[<StreamHandler stderr (NOTSET)>]

In [43]:
logger.handlers.clear() # 핸들러 클리어

### Logging 설정
1. configparser - 파일에 설정
2. argparser - 실행시점에 설정

#### configparser

- Section, Key, Value 값의 형태의 환경설정 File 사용
- 설정 파일을 Dict Type으로 호출해서 사용

In [50]:
!cat example.cfg

[SectionOne]
Status: Single
Name: Derek
Value: Yes
Age: 30
Single: True

[SectionTwo]
FavoriteColor = Green

[SectionThree]
FamilyName: Johnson

In [51]:
import configparser
config = configparser.ConfigParser()
config.sections()
config.read('example.cfg')
config.sections()

['SectionOne', 'SectionTwo', 'SectionThree']

In [52]:
print(f"config 타입: {type(config)}\ncofig: {config}")

config 타입: <class 'configparser.ConfigParser'>
cofig: <configparser.ConfigParser object at 0x106fe8d30>


In [58]:
# config의 SectionOne key값 출력
for key in config['SectionOne']:
    value = config['SectionOne'][key]
    print(f"{key} : {value}")
# config의 SectionOne status의 값 출력 (대소문자 상관없는듯)    
config['SectionOne']["status"]

status : Single
name : Derek
value : Yes
age : 30
single : True


'Single'

#### argparser
- Command-Line Option으로 프로그램 실행시 세팅
- 대부분의 Console 기반 Python 프로그램이 기본으로 제공

In [60]:
import argparse
parser = argparse.ArgumentParser(description='Sum two integers.')
parser.add_argument('-a', "--a_value", dest="A_value", help="A integers", type=int)
parser.add_argument('-b', "--b_value", dest="B_value", help="B integers", type=int)

args = parser.parse_args(args=[]) # args=[]를 넣어줘야 주피터에서 실행된다.
print(args)
args.a, args.b = map(int, input("a, b:").split(',')) # 주피터에서 argparse 쓰기위해 input을 사용

print(args.a)
print(args.b)
print(args.a + args.b)

Namespace(A_value=None, B_value=None)
a, b:10, 20
10
20
30


### Logging formmater

In [55]:
import logging

if __name__=='__main__':
    # 날짜 시간  레벨  processID  메시지
    formatter = logging.Formatter('%(asctime)s %(levelname)s %(process)d %(message)s')
    logger = logging.getLogger()
    
    # formatter 추가 -> stream_handler
    stream_handler = logging.StreamHandler()
    stream_handler.setFormatter(formatter)
    logger.addHandler(stream_handler)
    
    # default 레벨은 warning부터
    # level을 Debug로 바꿔서 모든 로깅 다 나오게 설정
    logging.basicConfig(level=logging.DEBUG)
    
    logger.debug("디버그")
    logger.info("인포")
    logger.warning("워닝")
    logger.error("에뤄")
    logger.critical("크뤼티칼!")

ERROR:root:에뤄
2022-09-22 12:17:44,585 ERROR 51085 에뤄
CRITICAL:root:크뤼티칼!
2022-09-22 12:17:44,586 CRITICAL 51085 크뤼티칼!


#### logging.conf 파일 읽어와서 로깅

In [57]:
import logging
import logging.config

logging.config.fileConfig('logging.conf')
conf_logger = logging.getLogger()

logger.debug("디버그")
logger.info("인포")
logger.warning("워닝")
logger.error("에뤄")
logger.critical("크뤼티칼!")

2022.09.22 12:18:15 PM - root - DEBUG - 디버그
2022.09.22 12:18:15 PM - root - INFO - 인포
2022.09.22 12:18:15 PM - root - ERROR - 에뤄
2022.09.22 12:18:15 PM - root - CRITICAL - 크뤼티칼!
