# 8.2 로깅

## logging 모듈

In [None]:
# logging 모듈
# ------------
# logging 모듈은 진단 정보를 기록하기 위한 표준 라이브러리 모듈이다. 
# 정교한 기능이 많은, 매우 큰 모듈이기도 하다. 유용한 몇 가지 예를 살펴보자.

In [None]:
# 예외 되돌아보기
# --------------
# 연습 문제에서 다음과 같은 parse() 함수를 작성했다.

# # fileparse.py
# def parse(f, types=None, names=None, delimiter=None):
#     records = []
#     for line in f:
#         line = line.strip()
#         if not line: continue
#         try:
#             records.append(split(line,types,names,delimiter))
#         except ValueError as e:
#             print("Couldn't parse :", line)
#             print("Reason :", e)
#     return records
# try-except 문에 집중하자. except 블록에서 무슨 일을 해야 할까?

# 경고 메시지를 출력해야 하나?

# try:
#     records.append(split(line,types,names,delimiter))
# except ValueError as e:
#     print("Couldn't parse :", line)
#     print("Reason :", e)
# 아니면 조용히 무시해야 하나?

# try:
#     records.append(split(line,types,names,delimiter))
# except ValueError as e:
#     pass

# 두 가지 행위를 모두 원할 수 있으므로(사용자가 선택) 어느 해결책도 만족스럽지 않을 것이다.

In [None]:
# fileparse1.py

def parse(f, types=None, names=None, delimiter=None):
    records = []
    for line in f:
        line = line.strip()
        if not line: continue
        try:
            records.append(split(line, types, names, delimiter))
        except ValueError as e:
            print("couldn't parse :", line)
            print("Reason :" e)
        # except ValueError as e:
        #     pass
    return records
            

## logging 모듈 사용하기

In [None]:
# logging 모듈 사용하기
# --------------------
# logging 모듈을 사용해 해결할 수 있다.

# # fileparse.py
# import logging
# log = logging.getLogger(__name__)

# def parse(f,types=None,names=None,delimiter=None):
#     ...
#     try:
#         records.append(split(line,types,names,delimiter))
#     except ValueError as e:
#         log.warning("Couldn't parse : %s", line)
#         log.debug("Reason : %s", e)

# 경고 메시지 또는 특수한 Logger 객체를 발행하도록 코드를 수정한다. logging.getLogger(__name__)으로 생성한 것이다.

In [None]:
# fileparse1.py

import logging
log = logging.getLogger(__name__)

def parse(f, types=None, names=None, delimiter=None):
    records = []
    for line in f:
        line = line.strip()
        if not line: continue
        try:
            records.append(split(line, types, names, delimiter))
        except ValueError as e:
            log.warning("Couldn't parse : %s", line)
            log.debug("Reason : %s", e)
    return records

## 로깅 기초

In [None]:
# 로깅 기초
# --------
# 로거 객체를 생성한다.

# log = logging.getLogger(name)   # name은 문자열이다

# 로그 메시지를 발행한다.

# log.critical(message [, args])
# log.error(message [, args])
# log.warning(message [, args])
# log.info(message [, args])
# log.debug(message [, args])

# 각 메시지는 심각도(severity) 수준이 각기 다르다.

# 이것들은 모두 포매팅된 로그 메시지를 생성한다. 메시지를 생성하기 위해 args를 % 연산자와 함께 사용한다.

# logmsg = message % args # 로그에 기록됨

## 로깅 설정

In [None]:
# 로깅 설정
# --------
# 로깅 작동을 각각 설정할 수 있다.

# # main.py

# ...

# if __name__ == '__main__':
#     import logging
#     logging.basicConfig(
#         filename  = 'app.log',      # Log output file
#         level     = logging.INFO,   # Output level
#     )
# 일반적으로, 프로그램이 시작할 때 한 번만 설정한다. 설정은 logging을 호출하는 코드와 분리된다.

## 부연 설명

In [None]:
# 부연 설명
# --------
# 로깅은 설정할 수 있는 폭이 넓다. 출력 파일, 수준, 메시지 포맷 등 모든 것을 설정할 수 있다. 
# 그렇지만, logging을 사용하는 코드는 그런 것에 신경쓰지 않아도 된다.

## 연습 문제

### 연습 문제 8.2: 모듈에 logging 추가하기

In [None]:
# 연습 문제 8.2: 모듈에 logging 추가하기
# ------------------------------------
# fileparse.py에는 잘못된 입력에 의해 발생하는 예외와 관련해 몇 가지 오류 처리가 있다. 다음과 같다.

# # fileparse.py
# import csv

# def parse_csv(lines, select=None, types=None, has_headers=True, delimiter=',', silence_errors=False):
#     '''
#     CSV 파일을 파싱 및 형변환하여 레코드의 리스트를 생성.
#     '''
#     if select and not has_headers:
#         raise RuntimeError('select requires column headers')

#     rows = csv.reader(lines, delimiter=delimiter)

#     # 파일 헤더가 있으면 읽음
#     headers = next(rows) if has_headers else []

#     # 특정 컬럼을 선택한 경우, 필터링을 위한 인덱스를 만들고 출력 컬럼을 설정
#     if select:
#         indices = [ headers.index(colname) for colname in select ]
#         headers = select

#     records = []
#     for rowno, row in enumerate(rows, 1):
#         if not row:     # 데이터가 없는 행을 건너뜀
#             continue

#         # 특정 컬럼 인덱스가 선택되었으면 그것을 고름
#         if select:
#             row = [ row[index] for index in indices]

#         # 행에 형변환을 적용
#         if types:
#             try:
#                 row = [func(val) for func, val in zip(types, row)]
#             except ValueError as e:
#                 if not silence_errors:
#                     print(f"Row {rowno}: Couldn't convert {row}")
#                     print(f"Row {rowno}: Reason {e}")
#                 continue

#         # 튜플의 딕셔너리를 만듦
#         if headers:
#             record = dict(zip(headers, row))
#         else:
#             record = tuple(row)
#         records.append(record)

#     return records
# 진단 메시지를 발행하는 print 문에 유의하라. 이 print를 logging 오퍼레이션으로 교체하는 것은 간단한 편이다. 코드를 다음과 같이 바꾸자.

# # fileparse.py
# import csv
# import logging
# log = logging.getLogger(__name__)

# def parse_csv(lines, select=None, types=None, has_headers=True, delimiter=',', silence_errors=False):
#     '''
#     CSV 파일을 파싱 및 형변환하여 레코드의 리스트를 생성.
#     '''
#     if select and not has_headers:
#         raise RuntimeError('select requires column headers')

#     rows = csv.reader(lines, delimiter=delimiter)

#     # 파일 헤더가 있으면 읽음
#     headers = next(rows) if has_headers else []

#     # 특정 컬럼을 선택한 경우, 필터링을 위한 인덱스를 만들고 출력 컬럼을 설정
#     if select:
#         indices = [ headers.index(colname) for colname in select ]
#         headers = select

#     records = []
#     for rowno, row in enumerate(rows, 1):
#         if not row:     # 데이터가 없는 행을 건너뜀
#             continue

#         # 특정 컬럼 인덱스가 선택되었으면 그것을 고름
#         if select:
#             row = [ row[index] for index in indices]

#         # 행에 형변환을 적용
#         if types:
#             try:
#                 row = [func(val) for func, val in zip(types, row)]
#             except ValueError as e:
#                 if not silence_errors:
#                     log.warning("Row %d: Couldn't convert %s", rowno, row)
#                     log.debug("Row %d: Reason %s", rowno, e)
#                 continue

#         # 튜플의 딕셔너리를 만듦
#         if headers:
#             record = dict(zip(headers, row))
#         else:
#             record = tuple(row)
#         records.append(record)

#     return records
# 이렇게 변경했으므로, 잘못된 데이터를 입력해보자.

# >>> import report
# >>> a = report.read_portfolio('Data/missing.csv')
# Row 4: Bad row: ['MSFT', '', '51.23']
# Row 7: Bad row: ['IBM', '', '70.44']
# >>>
# 기본값으로는 경고(WARNING) 수준 이상의 로깅 메시지만 출력된다. 출력은 단순한 print 문처럼 보인다. 
# 그렇지만 logging 모듈을 설정하는 경우 로깅 수준, 모듈 등의 추가적인 정보가 제공된다. 
# 다음과 같이 타이핑하여 확인해보자.

# >>> import logging
# >>> logging.basicConfig()
# >>> a = report.read_portfolio('Data/missing.csv')
# WARNING:fileparse:Row 4: Bad row: ['MSFT', '', '51.23']
# WARNING:fileparse:Row 7: Bad row: ['IBM', '', '70.44']
# >>>
# log.debug()의 출력은 나타나지 않는다. 디버그(DEBUG) 메시지도 나타나도록 수준을 변경해보자.

# >>> logging.getLogger('fileparse').level = logging.DEBUG
# >>> a = report.read_portfolio('Data/missing.csv')
# WARNING:fileparse:Row 4: Bad row: ['MSFT', '', '51.23']
# DEBUG:fileparse:Row 4: Reason: invalid literal for int() with base 10: ''
# WARNING:fileparse:Row 7: Bad row: ['IBM', '', '70.44']
# DEBUG:fileparse:Row 7: Reason: invalid literal for int() with base 10: ''
# >>>
# 심각(CRITICAL) 메시지만 나타나게 해 보자.

# >>> logging.getLogger('fileparse').level=logging.CRITICAL
# >>> a = report.read_portfolio('Data/missing.csv')
# >>>

In [1]:
import sys
sys.path.append('../../test_bed')

In [3]:
import report
import logging 
logging.basicConfig()
logging.getLogger('fileparse').level = logging.DEBUG
#logging.getLogger('fileparse').level = logging.CRITICAL

a = report.read_portfolio('../../data/missing.csv')

DEBUG:fileparse:Row 4: Reason invalid literal for int() with base 10: ''
DEBUG:fileparse:Row 7: Reason invalid literal for int() with base 10: ''


### 연습 문제 8.3: 프로그램에 로깅을 추가하기

In [None]:
# 연습 문제 8.3: 프로그램에 로깅을 추가하기
# --------------------------------------
# 애플리케이션에 로깅을 추가하려면 메인 모듈에서 로깅 모듈을 초기화하는 메커니즘이 필요하다. 
# 다음과 같은 셋업 코드를 포함하는 방식으로 할 수 있다.

# # 이 파일은 logging 모듈의 기본 구성을 설정한다.
# # 이 설정을 변경함으로써 로깅 출력을 원하는 대로 조정할 수 있다.
# import logging
# logging.basicConfig(
#     filename = 'app.log',            # 로그 파일의 이름(생략하면 stderr을 사용)
#     filemode = 'w',                  # 파일 모드('a': 추가)
#     # 로깅 수준(DEBUG, INFO, WARNING, ERROR, CRITICAL)
#     # DEBUG 설정    - 출력 : DEBUG, INFO, WARNING, ERROR, CRITICAL
#     # WARNING 설정  - 출력 : WARNING, ERROR, CRITICAL
#     # CRITICAL 설정 - 출력 : CRITICAL
#     level    = logging.WARNING,
# )
# 당신의 프로그램의 시작 단계에 이것을 두어야 한다. 예를 들어, report.py 프로그램의 어디에 두어야 할까?

In [1]:
import sys
sys.path.append('../../test_bed')

In [2]:
import report
#import logging 
#logging.basicConfig()
#logging.getLogger('fileparse').level = logging.DEBUG
#logging.getLogger('fileparse').level = logging.CRITICAL

a = report.read_portfolio('../../data/missing.csv')

In [None]:
# 8.3 디버깅

In [None]:
# 프로그램이 충돌했다...
# ---------------------

# bash % python3 blah.py
# Traceback (most recent call last):
#   File "blah.py", line 13, in ?
#     foo()
#   File "blah.py", line 10, in foo
#     bar()
#   File "blah.py", line 7, in bar
#     spam()
#   File "blah.py", 4, in spam
#     line x.append(3)
# AttributeError: 'int' object has no attribute 'append'

# 어떡하지?!

## 트레이스백 읽기

In [None]:
# 트레이스백 읽기
# --------------
# 마지막 행이 문제를 일으킨 주범이다.

# bash % python3 blah.py
# Traceback (most recent call last):
#   File "blah.py", line 13, in ?
#     foo()
#   File "blah.py", line 10, in foo
#     bar()
#   File "blah.py", line 7, in bar
#     spam()
#   File "blah.py", 4, in spam
#     line x.append(3)
# # 충돌 원인
# AttributeError: 'int' object has no attribute 'append'

# 그렇지만 읽고 이해하기가 쉽지만은 않다.

# 전문가의 조언: 트레이스백 전체를 구글에 붙여넣어 검색하라.

## REPL 사용하기

In [None]:
# REPL 사용하기
# ------------
# -i 옵션을 사용해 스크립트를 사용할 때 파이썬이 살아있도록 한다.

# bash % python3 -i blah.py
# Traceback (most recent call last):
#   File "blah.py", line 13, in ?
#     foo()
#   File "blah.py", line 10, in foo
#     bar()
#   File "blah.py", line 7, in bar
#     spam()
#   File "blah.py", 4, in spam
#     line x.append(3)
# AttributeError: 'int' object has no attribute 'append'
# >>>

# 이것은 인터프리터 상태를 유지한다. 충돌 이후에 여기저기 찔러볼 수 있다. 변숫값과 기타 상태를 확인한다.

## 프린트를 사용한 디버깅

In [None]:
# 프린트를 사용한 디버깅
# --------------------
# print() 디버깅은 꽤 일반적이다.

# 조언: repr()을 사용하라.

# def spam(x):
#     print('DEBUG:', repr(x))
#     ...
# repr()은 값의 정확한 표현(representation)을 나타낸다. 출력을 예쁘게 프린트하는 것과는 다르다.

# >>> from decimal import Decimal
# >>> x = Decimal('3.4')
# # `repr` 없이
# >>> print(x)
# 3.4
# # `repr` 사용
# >>> print(repr(x))
# Decimal('3.4')
# >>>

In [4]:
from decimal import Decimal
x = Decimal('3.4')
print(x)
print(repr(x))

3.4
Decimal('3.4')


## 파이썬 디버거

In [None]:
# 파이썬 디버거
# ------------
# 이 프로그램에서 디버거를 수작업으로 실행할 수 있다.

# def some_function():
#     ...
#     breakpoint()      # 디버거 진입(파이썬 3.7 이상)
#     ...
# 이것은 breakpoint() 호출에서 디버거를 시작한다.

# 이전 버전에서는 방법이 약간 다르다. 다른 디버깅 안내서에서 다음과 같이 설명하는 것을 볼 수 있을 것이다.

# import pdb
# ...
# pdb.set_trace()       # `breakpoint()` 대신 이것을 사용하라
# ...

## 디버거에서 실행하기

In [None]:
# 디버거에서 실행하기
# ------------------
# 전체 프로그램을 디버거에서 실행할 수도 있다.

# bash % python3 -m pdb someprogram.py
# 이렇게 하면 첫 번째 문장 이전에 디버거에 자동으로 진입한다. 중단점(breakpoint)을 설정하고 구성을 바꿔볼 수 있다.

# 일반적인 디버거 명령:

# (Pdb) help            # 도움말
# (Pdb) w(here)         # 스택 트레이스(stack trace)를 프린트
# (Pdb) d(own)          # 한 스택 수준 아래로 이동
# (Pdb) u(p)            # 한 스택 수준 위로 이동
# (Pdb) b(reak) loc     # 중단점 설정
# (Pdb) s(tep)          # 한 인스트럭션(instruction)을 실행
# (Pdb) c(ontinue)      # 계속 실행
# (Pdb) l(ist)          # 소스 코드 보기
# (Pdb) a(rgs)          # 현재 함수의 인자를 프린트
# (Pdb) !statement      # 문장(statement)을 실행

# 중단점 위치는 다음 중 하나다.

# (Pdb) b 45            # 현재 파일의 45행
# (Pdb) b file.py:34    # file.py의 34행
# (Pdb) b foo           # 현재 파일의 foo() 함수
# (Pdb) b module.foo    # module의 foo()