In [None]:
# 지금까지 파이썬 기초를 배웠으며 짧은 스크립트를 작성했다. 
# 하지만 더 큰 프로그램을 작성하려면 조직화할 필요가 있다. 
# 이 섹션은 함수를 작성하고 오류를 처리하는 방법을 자세히 다루며 모듈을 소개한다. 
# 끝에 가서는 여러 파일에 걸쳐 함수로 분할된 프로그램을 작성할 수 있다. 
# 스크립트를 작성하는 데 유용한 코드 템플릿도 제공한다.

# 3.1 스크립팅

## 스크립트(Script)란?

In [None]:
# 스크립트는 여러 문장을 실행한 다음 멈추는 프로그램이다.

# # program.py

# 문장1
# 문장2
# 문장3
# ...

# 위의 프로그램은 스크립트에 가깝다고 할 수 있다.

## 문제점

In [None]:
# 문제점
# -----
# 유용한 스크립트를 작성해 사용하다 보면 기능이 점차 늘어난다. 
# 관련된 다른 문제에도 적용하고 싶을 수 있다. 시간이 흐름에 따라, 스크립트는 점점 더 중요한 
# 애플리케이션이 되어 버릴 수도 있다. 
# 이제 주의를 기울이지 않으면 큰 문제가 일어날 수 있다. 그러므로 체계를 세워야 한다.

## 정의하기

In [None]:
# 나중에 재사용하려면 이름을 붙여둬야 한다.

# def square(x):
#     return x*x

# a = 42
# b = a + 2     # `a`가 정의돼 있어야 함

# z = square(b) # `square`와 `b`가 정의돼 있어야 함

# 순서가 중요하다. 변수와 함수의 정의를 항상 위쪽에 둬야 한다.

## 함수 정의하기

In [None]:
# 단일 작업에 관련된 코드를 한 곳에 모아두는 것이 현명하다. 함수 사용하기.

# def read_prices(filename):
#     prices = {}
#     with open(filename) as f:
#         f_csv = csv.reader(f)
#         for row in f_csv:
#             prices[row[0]] = float(row[1])
#     return prices

# 함수는 반복적인 연산을 단순화하기도 한다.

# oldprices = read_prices('oldprices.csv')
# newprices = read_prices('newprices.csv')

## 함수란 무엇인가?

In [None]:
# 함수는 문장의 시퀀스에 이름을 붙인 것이다.

# def funcname(args):
#   문장
#   문장
#   ...
#   return 결과

# 함수 내에 모든 파이썬 문장을 사용할 수 있다.

# def foo():
#     import math
#     print(math.sqrt(2))
#     help(math)

# 파이썬에는 특수한 문장이 없다(그러므로 기억하기 쉽다).

## 함수 정의

In [None]:
# 함수는 어떠한 순서로든 정의할 수 있다.

# def foo(x):
#     bar(x)

# def bar(x):
#     문장

# # 또는
# def bar(x):
#     문장

# def foo(x):
#     bar(x)

# 함수는 반드시 프로그램 실행 중 사용(호출)하기 전에 정의되어 있어야 한다.

# foo(3)        # foo가 정의돼 있어야 한다

# 함수는 상향식(bottom-up)으로 작성하는 것이 일반적이다.

## 상향식

In [None]:
# 함수는 빌딩 블록과 같이 다뤄진다. 작고 단순한 블록부터 먼저 만든다.

# myprogram.py
# def foo(x):
#     ...

# def bar(x):
#     ...
#     foo(x)          # 위에 정의됨
#     ...

# def spam(x):
#     ...
#     bar(x)          # 아래에 정의됨
#     ...

# spam(42)            # 함수를 사용하는 코드가 끝에 나타남

# 나중에 나오는 함수는 앞에 나온 함수를 바탕으로 한다. 
# 다시 말하지만, 이것은 스타일일 뿐이다. 
# 위 프로그램에서 중요한 것은 spam(42) 호출을 마지막에 해야 한다는 것 뿐이다.

## 함수 설계

In [None]:
# 함수는 블랙 박스(black box)로 간주하는 것이 이상적이다. 
# 전달된 입력만 가지고 연산을 하며 글로벌 변수의 사용이나 신비한 부작용을 배제해야 한다. 
# 모듈화(Modularity)와 예측가능성(Predictability)을 목표로 하라.


# 문서 문자열(Doc Strings)
# -----------------------
# 문서를 doc-string 형태로 코드에 포함하는 것이 좋다. 
# doc-strings은 함수 이름 바로 뒤에 직접 쓴 문자열이다. help(), IDE 및 기타 도구에서 인식한다.

# def read_prices(filename):
#     '''
#     CSV 파일에서 이름과 가격 데이터를 읽음
#     '''
#     prices = {}
#     with open(filename) as f:
#         f_csv = csv.reader(f)
#         for row in f_csv:
#             prices[row[0]] = float(row[1])
#     return prices

# 문서 문자열을 작성할 때는 함수가 무슨 일을 하는지를 짧은 문장으로 작성하는 것이 좋다. 
# 추가 정보가 필요할 때는 짧은 사용 예제와 함게 인자에 대한 자세한 설명을 넣어라.

## 타입 어노테이션(Type Annotations)

In [None]:
# 함수 정의에 선택적인 타입 힌트(type hint)를 추가할 수 있다.

# def read_prices(filename: str) -> dict:
#     '''
#     CSV 파일에서 이름과 가격 데이터를 읽음
#     '''
#     prices = {}
#     with open(filename) as f:
#         f_csv = csv.reader(f)
#         for row in f_csv:
#             prices[row[0]] = float(row[1])
#     return prices

# 힌트는 실제로 연산을 하지는 않는다. 순전히 정보성이다. 하지만, IDE, 코드 검사기, 기타 도구에서 사용된다.

## 연습 문제

In [8]:
# 섹션 2에서 주식 포트폴리오의 성과를 나타내는 보고서를 프린트하는 report.py 프로그램을 작성했다. 
# 이 프로그램에는 몇 가지 함수가 있다. 예:

# report.py
import csv

def read_portfolio(filename: str) -> list:
    '''
    주식 포트폴리오 파일을 읽어 딕셔너리의 리스트를 생성.
    name, shares, price를 키로 사용.
    '''
    portfolio = []
    with open(filename) as f:
        rows = csv.reader(f)
        headers = next(rows)

        for row in rows:
            record = dict(zip(headers, row))
            stock = {
                'name' : record['name'],
                'shares' : int(record['shares']),
                'price' : float(record['price'])
            }
            portfolio.append(stock)
    return portfolio

portfolio = read_portfolio('../../data/portfolio.csv') 
print(portfolio)

# 하지만, 스크립트로 된 일련의 계산을 수행하는 프로그램 부분도 있다. 이 코드는 프로그램의 끝 부분 근처에 있다. 예:


# 보고서를 출력

headers = ('Name', 'Shares', 'Price', 'Change')
print('%10s %10s %10s %10s'  % headers)
print(('-' * 10 + ' ') * len(headers))
for row in portfolio:
    print(f"{row['name']:>10s} {row['shares']:>10d} {row['price']:>10.2f} {'None':>10s}")
    #print('%10s %10d %10.2f %10.2f' % row)

# 이 연습 문제에서, 이 프로그램의 함수 사용 부분을 좀 더 강력하게 조직화한다.

[{'name': 'AA', 'shares': 100, 'price': 32.2}, {'name': 'IBM', 'shares': 50, 'price': 91.1}, {'name': 'CAT', 'shares': 150, 'price': 83.44}, {'name': 'MSFT', 'shares': 200, 'price': 51.23}, {'name': 'GE', 'shares': 95, 'price': 40.37}, {'name': 'MSFT', 'shares': 50, 'price': 65.1}, {'name': 'IBM', 'shares': 100, 'price': 70.44}]
      Name     Shares      Price     Change
---------- ---------- ---------- ---------- 
        AA        100      32.20       None
       IBM         50      91.10       None
       CAT        150      83.44       None
      MSFT        200      51.23       None
        GE         95      40.37       None
      MSFT         50      65.10       None
       IBM        100      70.44       None


### 연습 문제 3.1: 프로그램을 함수의 컬렉션으로 구조화

In [97]:
# 계산과 출력을 포함한 모든 주요 연산을 함수의 컬렉션에 의해 수행하도록 report.py 프로그램을 수정하자. 
# 특히,
# - 보고서를 출력하는 print_report(report) 함수를 작성한다.
# - 프로그램의 마지막 부분을 수정해 일련의 함수만 남기고 계산 코드를 없애자.

import csv
from babel.numbers import format_currency

def read_portfolio(filename: str) -> list:
    portfolio = []
    types = [str, int, float]
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        headers = next(rows)
        for row in rows:
            record = {name: func(val) for name, func, val in zip(headers, types, row)}
            portfolio.append(record)
    return portfolio            
        

def read_prices(filename: str) -> dict:
    prices = {}
    types = [str, float]
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        for row in rows:
            prices[row[0]] = float(row[1])
    return prices        
        

def make_report(portfolio, prices) -> list:
    report = []
    for stock in portfolio:
        record = {}
        
        record['name'] = stock['name']
        record['shares'] = stock['shares']
        record['buy_price'] = stock['price']
        record['cur_price'] = prices[stock['name']]
        record['change'] = record['cur_price'] - record['buy_price']
        
        report.append(record)
    return report
        

def print_report(report: list) -> None:
    headers = ('Name', 'Shares', 'Buy_Price', 'Cur_Price', 'Change')
    print('%10s %10s %10s %10s %10s'  % headers)
    
    print(('-' * 10 + ' ') * len(headers))
    for row in report:
        print(f"{row['name']:>10s} {row['shares']:>10d} {format_currency(row['buy_price'], 'USD', locale='en_US'):>10s} {format_currency(row['cur_price'], 'USD', locale='en_US'):>10s}{row['change']:>10.2f}")
    print(('-' * 10 + ' ') * len(headers))

if __name__ == '__main__':
    portfolio = read_portfolio('../../data/portfolio.csv')
    prices = read_prices('../../data/prices.csv')     
    report = make_report(portfolio, prices)
    
    print_report(report)
    
    total_income = 0
    for r in report:
        total_income += r['shares']*r['change']
    print(f"Total Income: {format_currency(total_income, 'USD', locale='en_US')}  ({format_currency(total_income * 1300, 'KRW', locale='ko_KR')})")        


      Name     Shares  Buy_Price  Cur_Price     Change
---------- ---------- ---------- ---------- ---------- 
        AA        100     $32.20      $9.22    -22.98
       IBM         50     $91.10    $106.28     15.18
       CAT        150     $83.44     $35.46    -47.98
      MSFT        200     $51.23     $20.89    -30.34
        GE         95     $40.37     $13.48    -26.89
      MSFT         50     $65.10     $20.89    -44.21
       IBM        100     $70.44    $106.28     35.84
---------- ---------- ---------- ---------- ---------- 
Total Income: -$15,985.05  (-₩20,780,565)


### 연습 문제 3.2: 프로그램 실행을 위한 최상위 함수를 작성

In [107]:
# 프로그램의 마지막 부분을 가지고 단일 함수 portfolio_report(portfolio_filename, prices_filename)로 패키징하라. 
# 그 함수에서 다음과 같이 호출해, 이전과 똑같은 보고서를 생성하자.
import csv
from babel.numbers import format_currency

def read_portfolio(filename: str) -> list:
    portfolio = []
    types = [str, int, float]
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        headers = next(rows)
        for row in rows:
            record = {name: func(val) for name, func, val in zip(headers, types, row)}
            portfolio.append(record)
    return portfolio            
        

def read_prices(filename: str) -> dict:
    prices = {}
    types = [str, float]
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        for row in rows:
            prices[row[0]] = float(row[1])
    return prices        
        

def make_report(portfolio, prices) -> list:
    report = []
    for stock in portfolio:
        record = {}
        
        record['name'] = stock['name']
        record['shares'] = stock['shares']
        record['buy_price'] = stock['price']
        record['cur_price'] = prices[stock['name']]
        record['change'] = record['cur_price'] - record['buy_price']
        
        report.append(record)
    return report
        

def print_report(report: list) -> None:
    headers = ('Name', 'Shares', 'Buy_Price', 'Cur_Price', 'Change')
    print('%10s %10s %10s %10s %10s'  % headers)
    
    print(('-' * 10 + ' ') * len(headers))
    for row in report:
        print(f"{row['name']:>10s} {row['shares']:>10d} {format_currency(row['buy_price'], 'USD', locale='en_US'):>10s} {format_currency(row['cur_price'], 'USD', locale='en_US'):>10s}{row['change']:>10.2f}")
    print(('-' * 10 + ' ') * len(headers))


def portfolio_report(portfolio_filename, prices_filename):
    portfolio = read_portfolio(portfolio_filename)
    prices = read_prices(prices_filename)     
    report = make_report(portfolio, prices)
    
    print_report(report)
    
    total_income = 0
    for r in report:
        total_income += r['shares']*r['change']
    print(f"Total Income: {format_currency(total_income, 'USD', locale='en_US')}  ({format_currency(total_income * 1300, 'KRW', locale='ko_KR')})")        

if __name__ == '__main__':
    # portfolio_report('../../data/portfolio.csv', '../../data/prices.csv')
    # print()
    # portfolio_report('../../data/portfolio2.csv', '../../data/prices.csv')

    files = ['../../data/portfolio.csv', '../../data/portfolio2.csv']
    for name in files:
        print(f'{name:^43s}')
        portfolio_report(name, '../../data/prices.csv')
        print()


# portfolio_report('Data/portfolio.csv', 'Data/prices.csv')

# 이 최종 버전에는 일련의 함수 정의와 함께, 맨 마지막에 portfolio_report() 함수 호출만 유일하게 남긴다(이 함수가 이 프로그램과 관련된 모든 단계를 실행).

# 프로그램을 단일 함수로 바꾸면 입력이 바뀌더라도 쉽게 실행할 수 있다. 예를 들어, 상호작용 모드에서 프로그램을 실행한 후 다음과 같은 문장을 실행해 보라.

# >>> portfolio_report('Data/portfolio2.csv', 'Data/prices.csv')
# ... 출력을 보라 ...
# >>> files = ['Data/portfolio.csv', 'Data/portfolio2.csv']
# >>> for name in files:
#         print(f'{name:-^43s}')
#         portfolio_report(name, 'prices.csv')
#         print()

# ... 출력을 보라 ...
# >>>

         ../../data/portfolio.csv          
      Name     Shares  Buy_Price  Cur_Price     Change
---------- ---------- ---------- ---------- ---------- 
        AA        100     $32.20      $9.22    -22.98
       IBM         50     $91.10    $106.28     15.18
       CAT        150     $83.44     $35.46    -47.98
      MSFT        200     $51.23     $20.89    -30.34
        GE         95     $40.37     $13.48    -26.89
      MSFT         50     $65.10     $20.89    -44.21
       IBM        100     $70.44    $106.28     35.84
---------- ---------- ---------- ---------- ---------- 
Total Income: -$15,985.05  (-₩20,780,565)

         ../../data/portfolio2.csv         
      Name     Shares  Buy_Price  Cur_Price     Change
---------- ---------- ---------- ---------- ---------- 
        AA         50     $27.10      $9.22    -17.88
       HPQ        250     $43.15     $34.35     -8.80
      MSFT         25     $50.15     $20.89    -29.26
        GE        125     $52.10     $13.48    -38.

# 3.2 함수의 작동

## 함수 호출하기

In [None]:
# 함수 호출하기
# -------------

# 이 함수를 생각해 보자.

# def read_prices(filename, debug):
#     ...

# 위치 인자를 사용해 함수를 호출할 수 있다.
# prices = read_prices('prices.csv', True)

# 키워드 인자를 가지고 함수를 호출할 수도 있다.
# prices = read_prices(filename='prices.csv', debug=True)



# 기본 인자
# ---------

# 인자를 선택 사항으로 하고 싶을 때가 있다. 그런 경우에는 함수 정의에 기본값을 정해두라.
# def read_prices(filename, debug=False):
#     ...

# 기본값이 할당되면 인자는 함수 호출시 선택사항이 된다.
# d = read_prices('prices.csv')
# e = read_prices('prices.dat', True)

# 참고: 기본값이 있는 인자는 반드시 인자 리스트의 끝에 두어야 한다(선택적이지 않은 인자가 모두 앞쪽에 와야 한다).



# 선택적 인자를 키워드 인자로 하면 좋다.
# -------------------------------------

# 두 가지 호출 방식을 비교, 대조해보자.

# parse_data(data, False, True) # ?????

# parse_data(data, ignore_errors=True)
# parse_data(data, debug=True)
# parse_data(data, debug=True, ignore_errors=True)

# 키워드 인자를 사용하는 것이 대체로 가독성이 높다. 플래그 역할을 하는 인자라든지, 선택적 기능과 관련된 경우 특히 그렇다.



# 설계 모범 사례
# --------------
# 함수 인자에는 항상 짧고 의미 있는 이름을 붙인다.

# 함수를 키워드 호출 스타일로 사용하고 싶을 수도 있다.
# d = read_prices('prices.csv', debug=True)

# 파이썬 개발 도구는 도움말 기능과 문서에서 이름을 표시한다.

## 값을 반환

In [None]:
# 값을 반환
# ---------
# return 문을 값을 반환한다.

# def square(x):
#     return x * x

# 반환값이 주어지지 않거나 return 문이 없으면 None을 반환한다.

# def bar(x):
#     문장
#     return

# a = bar(4)      # a = None

# # 또는
# def foo(x):
#     statements  # `return`이 없음

# b = foo(4)      # b = None


# 여러 개의 반환값
# ----------------
# 함수는 단 하나의 값만 반환할 수 있다. 하지만, 튜플에 여러 값을 담아 반환할 수 있다.

# def divide(a,b):
#     q = a // b      # 몫
#     r = a % b       # 나머지
#     return q, r     # 튜플을 반환

# 용례:
# x, y = divide(37,5) # x = 7, y = 2
# x = divide(37, 5)   # x = (7, 2)

## 변수 스코프

In [None]:
# 변수 스코프
# -----------
# 프로그램은 변수에 값을 할당한다.

# x = value # 글로벌 변수

# def foo():
#     y = value # 로컬 변수

# 변수 할당은 함수 정의의 안팎에서 일어난다. 바깥에서 정의된 변수는 '글로벌'이다. 함수 내의 변수는 '로컬'이다.


# 로컬 변수
# ---------
# 함수 내에 할당된 변수는 프라이빗이다.

# def read_portfolio(filename):
#     portfolio = []
#     for line in open(filename):
#         fields = line.split(',')
#         s = (fields[0], int(fields[1]), float(fields[2]))
#         portfolio.append(s)
#     return portfolio

# 이 예에서, filename, portfolio, line, fields, s는 로컬 변수다. 
# 이 변수들은 함수 호출 이후에 보존되지 않으므로 이것들에 액세스할 수 없다.

# >>> stocks = read_portfolio('portfolio.csv')
# >>> fields
# Traceback (most recent call last):
# File "<stdin>", line 1, in ?
# NameError: name 'fields' is not defined
# >>>

# 로컬은 다른 곳의 변수와 충돌할 일이 없다.


# 글로벌 변수
# -----------
# 함수는 같은 파일에 정의된 글로벌들의 값에 자유롭게 액세스할 수 있다.

# name = 'Dave'
# def greeting():
#     print('Hello', name)  # 글로벌 변수 `name`을 사용

# 단, 함수는 글로벌을 수정할 수 없다.

# name = 'Dave'
# def spam():
#   name = 'Guido'
# spam()
# print(name) # 'Dave'를 프린트

# 기억해줘: 함수 내의 모든 할당은 로컬이다.



# 글로벌을 수정하기
# -----------------
# 글로벌 변수를 수정해야만 한다면 다음과 같은 방법으로 선언한다.

# name = 'Dave'

# def spam():
#     global name
#     name = 'Guido' # 위 글로벌 name을 변경

# 글로벌을 사용하기 전에 선언이 먼저 나타나야 하며, 관련된 변수는 반드시 함수와 같은 파일에 있어야 한다. 
# 글로벌을 사용하는 법을 알아보기는 했지만, 별로 좋은 것은 아니다. 
# global을 아예 사용하지 않는 것이 상책이다. 
# 함수가 외부의 상태를 변경할 필요가 있다면, 차라리 클래스를 사용해라(나중에 다룬다).


## 인자 전달

In [None]:
# 함수를 호출할 때, 인자 변수는 전달된 값을 참조하는 이름이다. 
# 이 변수들은 사본이 아니다(섹션 2.7을 참조). 
# 변경가능한 자료형(예: list, dict)을 전달하면 제자리에서 수정될 수 있다.

# def foo(items):
#     items.append(42)    # 입력 객체를 수정

# a = [1, 2, 3]
# foo(a)
# print(a)                # [1, 2, 3, 42]

# 핵심: 함수는 입력 인자의 사본을 받지 않는다.



# 재할당 vs 수정
# --------------
# 변수를 수정하는 것과 변수명을 재할당하는 것의 미묘한 차이를 이해해야 한다.

# def foo(items):
#     items.append(42)    # 입력 객체를 수정

# a = [1, 2, 3]
# foo(a)
# print(a)                # [1, 2, 3, 42]

# # VS
# def bar(items):
#     items = [4,5,6]    # 다른 객체를 가리키도록 로컬 `items` 변수를 변경

# b = [1, 2, 3]
# bar(b)
# print(b)                # [1, 2, 3]

# 기억해줘: 변수 할당은 메모리를 절대 덮어쓰지 않는다. 이름은 새 값에 바운드된다.

## 연습 문제

In [None]:
# 이 연습 문제들은 이 코스에서 가장 강력하고 어려운 부분을 구현한다. 
# 지금까지의 연습 문제를 통해 익힌 여러 개념을 한 곳에 모은다. 
# 최종적인 해답은 25줄 가량의 코드에 불과하지만, 시간을 들여 각 부분을 이해하도록 노력하라.

# report.py 프로그램에서 중요한 부분은 CSV 파일을 읽는 것이다. 
# 예를 들어 read_portfolio() 함수는 포트폴리오 데이터의 행을 포함한 파일을 읽으며, 
# read_prices() 함수는 가격 데이터의 행을 포함한 파일을 읽는다. 
# 두 함수 모두 저수준의 "fiddly" 비트가 있고 기능이 서로 비슷한다. 
# 예를 들어, 파일을 열고 csv 모듈을 사용해 감싸서 값을 새로운 타입으로 변환한다.

# 파일 파싱을 실제로 많이 한다면 이런 것들을 깔끔하게 정리해 좀 더 일반적으로 
# 사용할 수 있게 하는 것이 좋다. 이것이 우리 목표다.

# Work/fileparse.py 파일을 열어 이 연습을 시작하자. 이 파일을 가지고 작업한다.

### 연습 문제 3.3: CSV 파일 읽기

In [3]:
# 먼저 CSV 파일을 읽어 딕셔너리의 리스트에 넣는 문제부터 해결하자. fileparse.py 파일에 다음과 같은 함수를 정의한다.

# fileparse.py
import csv

def parse_csv(filename):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        
        # 헤더(머리말)를 읽음
        headers = next(rows)
        records = []
        for row in rows:
            if not row:         # 데이터가 없는 행은 건너뜀
                continue
            record = dict(zip(headers, row))
            records.append(record)
    return records

portfolio = parse_csv('../../data/portfolio.csv')
portfolio
# 이 함수는 CSV 파일을 읽어 딕셔너리의 리스트를 생성하되, 파일을 열고 csv 모듈을 가지고 감싸고, 공백 행을 건너뛰는 등의 세부사항을 숨긴다.

# 한번 사용해 보자.
# 힌트: python3 -i fileparse.py.

# >>> portfolio = parse_csv('Data/portfolio.csv')
# >>> portfolio
# [{'price': '32.20', 'name': 'AA', 'shares': '100'}, {'price': '91.10', 'name': 'IBM', 'shares': '50'}, {'price': '83.44', 'name': 'CAT', 'shares': '150'}, {'price': '51.23', 'name': 'MSFT', 'shares': '200'}, {'price': '40.37', 'name': 'GE', 'shares': '95'}, {'price': '65.10', 'name': 'MSFT', 'shares': '50'}, {'price': '70.44', 'name': 'IBM', 'shares': '100'}]

# 이 함수는 좋긴 하지만, 모든 것을 문자열로 표현하기 때문에 계산에 사용할 수 없다는 아쉬움이 있다. 
# 이 점을 곧 수정하겠지만, 일단은 계속 만들어 나가자.

[{'name': 'AA', 'shares': '100', 'price': '32.20'},
 {'name': 'IBM', 'shares': '50', 'price': '91.10'},
 {'name': 'CAT', 'shares': '150', 'price': '83.44'},
 {'name': 'MSFT', 'shares': '200', 'price': '51.23'},
 {'name': 'GE', 'shares': '95', 'price': '40.37'},
 {'name': 'MSFT', 'shares': '50', 'price': '65.10'},
 {'name': 'IBM', 'shares': '100', 'price': '70.44'}]

### 연습 문제 3.4: 컬럼 선택기 구축하기

In [27]:
# CSV 파일의 모든 데이터가 아니라 일부에만 관심이 있는 때가 많을 것이다. 
# 다음과 같이, 가져올 컬럼을 사용자가 선택할 수 있게 parse_csv() 함수를 수정해 보자.

# 일부 데이터만 읽기
# fileparse.py
import csv

def parse_csv(filename, select=None):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        
        # 헤더(머리말)를 읽음
        headers = next(rows)
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for row in rows:
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            # 특정 컬럼이 선택되었으면 필터링
            if indices:
                row = [ row[index] for index in indices ]
            
            # 딕셔너리를 만듦    
            record = dict(zip(headers, row))
            records.append(record)
    return records

# 일부 데이터만 읽기
shares_held = parse_csv('../../data/portfolio.csv', ['name','price'])
shares_held

# 이 부분에 몇 가지 트릭이 있다. 컬럼 선택을 행 인덱스에 매핑하는 부분이 가장 중요할 것이다. 
# 예를 들어, 입력 파일에 다음과 같은 헤더가 있다고 하자.

# >>> headers = ['name', 'date', 'time', 'shares', 'price']
# >>>
# 선택한 컬럼은 다음과 같다고 하자.

# >>> select = ['name', 'shares']
# >>>
# 적절한 선택을 위해, 선택한 컬럼명을 파일의 컬럼 인덱스에 매핑해야 한다. 이 단계에서 그 일을 한다.

# >>> indices = [headers.index(colname) for colname in select ]
# >>> indices
# [0, 3]


# 달리 말해, "name"은 컬럼 0이고 "shares"는 컬럼 3이다. 파일에서 데이터 행을 읽을 때, 
# 인덱스를 사용해 원하는 컬럼만 얻을 수 있다.

# >>> row = ['AA', '6/11/2007', '9:50am', '100', '32.20' ]
# >>> row = [ row[index] for index in indices ]
# >>> row
# ['AA', '100']
# >>>

[{'name': 'AA', 'price': '32.20'},
 {'name': 'IBM', 'price': '91.10'},
 {'name': 'CAT', 'price': '83.44'},
 {'name': 'MSFT', 'price': '51.23'},
 {'name': 'GE', 'price': '40.37'},
 {'name': 'MSFT', 'price': '65.10'},
 {'name': 'IBM', 'price': '70.44'}]

### 연습 문제 3.5: 형변환 수행하기

In [37]:
# 반환된 데이터에 형변환을 적용할지 선택할 수 있게 parse_csv() 함수를 수정해보자. 예:
# fileparse.py
import csv

def parse_csv(filename, select=None, types=[str, int, float]):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        
        # 헤더(머리말)를 읽음
        headers = next(rows)
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for row in rows:
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            # 특정 컬럼이 선택되었으면 필터링 과 자료형 변환
            if indices:
                row = [ row[index] for index in indices ]
     
            if types:
                row = [func(val) for func, val in zip(types, row) ]

            # 딕셔너리를 만듦    
            record = dict(zip(headers, row))
            records.append(record)
    return records

# 일부 데이터만 읽기
shares_held = parse_csv('../../data/portfolio.csv', ['name','price'], [str, float])
# shares_held = parse_csv('../../data/portfolio.csv')

shares_held

# 이것을 연습 문제 2.24에서 이미 탐구했다. 다음 코드를 당신의 코드에 포함시키자.

# ...
# if types:
#     row = [func(val) for func, val in zip(types, row) ]
# ...

[{'name': 'AA', 'price': 32.2},
 {'name': 'IBM', 'price': 91.1},
 {'name': 'CAT', 'price': 83.44},
 {'name': 'MSFT', 'price': 51.23},
 {'name': 'GE', 'price': 40.37},
 {'name': 'MSFT', 'price': 65.1},
 {'name': 'IBM', 'price': 70.44}]

In [45]:
# CSV 파일에 헤더 정보가 없는 경우도 있다 예를 들어, prices.csv는 다음과 같이 되어 있다.

# "AA",9.22
# "AXP",24.85
# "BA",44.85
# "BAC",11.27
# ...

# 튜플의 리스트를 생성함으로써 이런 파일을 다룰 수 있게 parse_csv() 함수를 수정해보자.
# fileparse.py
import csv

def parse_csv(filename, select=None, types=[str, int, float], has_headers=False):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    with open(filename, 'r') as f:
        rows = csv.reader(f)
        
        # 헤더(머리말)를 읽음
        if has_headers:
            headers = next(rows)
        else:
            headers = []
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for row in rows:
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            # 특정 컬럼이 선택되었으면 필터링 과 자료형 변환
            if indices:
                row = [ row[index] for index in indices ]
     
            if types:
                row = [func(val) for func, val in zip(types, row) ]

            # 딕셔너리를 만듦
            if has_headers:    
                record = dict(zip(headers, row))
            else:
                record = tuple(row)
            records.append(record)
    return records

# 일부 데이터만 읽기
shares_held = parse_csv('../../data/portfolio.csv', ['name','price'], [str, float], has_headers=True)
#shares_held = parse_csv('../../data/portfolio.csv', has_headers=True)
prices = parse_csv('../../data/prices.csv', types=[str,float], has_headers=False)


print(shares_held)
print(prices)

# >>> prices = parse_csv('Data/prices.csv', types=[str,float], has_headers=False)
# >>> prices
# [('AA', 9.22), ('AXP', 24.85), ('BA', 44.85), ('BAC', 11.27), ('C', 3.72), ('CAT', 35.46), ('CVX', 66.67), ('DD', 28.47), ('DIS', 24.22), ('GE', 13.48), ('GM', 0.75), ('HD', 23.16), ('HPQ', 34.35), ('IBM', 106.28), ('INTC', 15.72), ('JNJ', 55.16), ('JPM', 36.9), ('KFT', 26.11), ('KO', 49.16), ('MCD', 58.99), ('MMM', 57.1), ('MRK', 27.58), ('MSFT', 20.89), ('PFE', 15.19), ('PG', 51.94), ('T', 24.79), ('UTX', 52.61), ('VZ', 29.26), ('WMT', 49.74), ('XOM', 69.35)]
# >>>
# 이렇게 변경하려면 데이터의 첫행이 헤더 파일로 인식되지 않게 코드를 수정해야 한다. 또한, 컬럼명을 키로 삼아 딕셔너리를 생성하지 않게 수정해야 한다.

[{'name': 'AA', 'price': 32.2}, {'name': 'IBM', 'price': 91.1}, {'name': 'CAT', 'price': 83.44}, {'name': 'MSFT', 'price': 51.23}, {'name': 'GE', 'price': 40.37}, {'name': 'MSFT', 'price': 65.1}, {'name': 'IBM', 'price': 70.44}]
[('AA', 9.22), ('AXP', 24.85), ('BA', 44.85), ('BAC', 11.27), ('C', 3.72), ('CAT', 35.46), ('CVX', 66.67), ('DD', 28.47), ('DIS', 24.22), ('GE', 13.48), ('GM', 0.75), ('HD', 23.16), ('HPQ', 34.35), ('IBM', 106.28), ('INTC', 15.72), ('JNJ', 55.16), ('JPM', 36.9), ('KFT', 26.11), ('KO', 49.16), ('MCD', 58.99), ('MMM', 57.1), ('MRK', 27.58), ('MSFT', 20.89), ('PFE', 15.19), ('PG', 51.94), ('T', 24.79), ('UTX', 52.61), ('VZ', 29.26), ('WMT', 49.74), ('XOM', 69.35)]


### 연습 문제 3.7: 다른 컬럼 구분자(delimitier)를 사용하기

In [150]:
# %%writefile ../../test_bed/fileparse.py
# 콤마를 구분자로 사용하는 것이 일반적이지만, 탭이나 공백을 컬럼 구분자로 사용하는 경우도 있다. 그 예로, Data/portfolio.dat은 다음과 같다.

# name shares price
# "AA" 100 32.20
# "IBM" 50 91.10
# "CAT" 150 83.44
# "MSFT" 200 51.23
# "GE" 95 40.37
# "MSFT" 50 65.10
# "IBM" 100 70.44
# csv.reader() 함수는 구분자를 변경하는 기능이 있다.

# rows = csv.reader(f, delimiter=' ')
# 구분자를 변경할 수 있게 parse_csv() 함수를 수정해보자.

# fileparse.py
import csv

def parse_csv(filename, select=None, types=[str, int, float], has_headers=False, delimiter=','):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    with open(filename, 'r') as f:
        dell = ','
        rows = csv.reader(f, delimiter=delimiter)
        # rows = csv.reader(f, delimiter=' ')
        
        
        # 헤더(머리말)를 읽음
        if has_headers:
            headers = next(rows)
        else:
            headers = []
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for row in rows:
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            # 특정 컬럼이 선택되었으면 필터링 과 자료형 변환
            if indices:
                row = [ row[index] for index in indices ]
     
            if types:
                row = [func(val) for func, val in zip(types, row) ]

            # 딕셔너리를 만듦
            if has_headers:    
                record = dict(zip(headers, row))
            else:
                record = tuple(row)
            records.append(record)
    return records

# 일부 데이터만 읽기
# shares_held = parse_csv('../../data/portfolio.csv', ['name','price'], [str, float], has_headers=True)
#shares_held = parse_csv('../../data/portfolio.csv', has_headers=True)
# prices = parse_csv('../../data/prices.csv', types=[str,float], has_headers=False)
portfolio = parse_csv('../../data/portfolio.dat', types=[str, int, float], has_headers=True, delimiter=' ')


# print(shares_held)
# print(prices)
print(portfolio)

# >>> portfolio = parse_csv('Data/portfolio.dat', types=[str, int, float], delimiter=' ')
# >>> portfolio
# [{'price': '32.20', 'name': 'AA', 'shares': '100'}, {'price': '91.10', 'name': 'IBM', 'shares': '50'}, {'price': '83.44', 'name': 'CAT', 'shares': '150'}, {'price': '51.23', 'name': 'MSFT', 'shares': '200'}, {'price': '40.37', 'name': 'GE', 'shares': '95'}, {'price': '65.10', 'name': 'MSFT', 'shares': '50'}, {'price': '70.44', 'name': 'IBM', 'shares': '100'}]
# >>>
# 부연 설명

Overwriting ../../test_bed/fileparse.py


# 3.3 오류 검사

## 프로그램은 어떻게 실패하는가

In [None]:
# 파이썬은 인자 타입이나 값에 대한 검사나 검증을 수행하지 않는다. 
# 어떤 데이터든 함수에 기술한 것과 호환되기만 하면 함수가 작동한다.

# def add(x, y):
#     return x + y

# add(3, 4)               # 7
# add('Hello', 'World')   # 'HelloWorld'
# add('3', '4')           # '34'

# 함수에 오류가 있으면 실행시간에 예외로서 나타난다.
# def add(x, y):
#     return x + y

# >>> add(3, '4')
# Traceback (most recent call last):
# ...
# TypeError: unsupported operand type(s) for +:
# 'int' and 'str'
# >>>

# 코드를 검증하기 위해 테스팅을 매우 중요시한다(나중에 다룬다).

## 예외(Exception)

In [None]:
# 예외는 오류에 대한 신호로 사용된다. 예외를 일으키고 싶으면 raise 문을 사용하라.

# if name not in authorized:
#     raise RuntimeError(f'{name} not authorized')
# 예외를 붙잡으려면 try-except를 사용한다.

# try:
#     authenticate(username)
# except RuntimeError as e:
#     print(e)


# 예외 처리
# --------
# 예외는 처음 일치하는 except까지 전파된다.

# def grok():
#     ...
#     raise RuntimeError('Whoa!')   # 여기서 예외가 발생

# def spam():
#     grok()                        # 호출하면 예외가 발생

# def bar():
#     try:
#        spam()
#     except RuntimeError as e:     # 예외를 여기서 잡음
#         ...

# def foo():
#     try:
#          bar()
#     except RuntimeError as e:     # 예외는 여기 도달하지 않음
#         ...

# foo()



# 예외를 처리하려면 except 블록에 문장을 넣는다. 예외를 처리하는 데 사용하고 싶은 문장을 무엇이든 넣을 수 있다.

# def grok(): ...
#     raise RuntimeError('Whoa!')

# def bar():
#     try:
#       grok()
#     except RuntimeError as e:   # 예외를 여기서 잡음
#         statements              # 이 문장을 사용
#         문장
#         ...

# bar()



# 처리한 다음, try-except 이후 첫 번째 문장으로 실행을 재개한다.

# def grok(): ...
#     raise RuntimeError('Whoa!')

# def bar():
#     try:
#       grok()
#     except RuntimeError as e:   # 예외를 여기서 잡음
#         문장
#         문장
#         ...
#     문장                                # 예외를 여기서 재개
#     문장                                # 여기서 계속
#     ...

# bar()


## 빌트인 예외

In [None]:
# 빌트인 예외
# -----------
# 스무 가지가 넘는 빌트인 예외가 있다. 예외 이름은 무엇이 잘못됐는지 지시한다(예: 잘못된 값을 제공하면 ValueError가 일어난다). 이 목록에 있는 것 외에도 더 있다. 더 알고 싶으면 문서를 참조하라.

# ArithmeticError
# AssertionError
# EnvironmentError
# EOFError
# ImportError
# IndexError
# KeyboardInterrupt
# KeyError
# MemoryError
# NameError
# ReferenceError
# RuntimeError
# SyntaxError
# SystemError
# TypeError
# ValueError

## 예외 값

In [None]:
# 예외 값
# -------
# 예외에는 관련 값이 있다. 무엇이 잘못됐는지 구체적으로 알려주는 정보가 포함된다.

# raise RuntimeError('Invalid user name')
# 이 값은 예외 인스턴스의 일부이며 except에 제공된 변수에 배치된다.

# try:
#     ...
# except RuntimeError as e:   # 발생한 예외를 `e`로 가리킨다
#     ...
# e는 예외 타입의 인스턴스다. 하지만, 이것을 프린트하면 문자열처럼 보인다.

# except RuntimeError as e:
#     print('Failed : Reason', e)

## 여러 오류를 잡기

In [None]:
# 여러 오류를 잡기
# except 블록을 여러 개 사용해서 서로 다른 종류의 예외를 붙잡을 수 있다.

# try:
#   ...
# except LookupError as e:
#   ...
# except RuntimeError as e:
#   ...
# except IOError as e:
#   ...
# except KeyboardInterrupt as e:
#   ...
# 또는, 처리하는 명령문이 동일하다면 그룹화할 수 있다.

# try:
#   ...
# except (IOError,LookupError,RuntimeError) as e:
#   ...


## 모든 오류를 붙잡기

In [None]:
# 모든 오류를 붙잡기
# ------------------
# 예외를 붙잡으려면 다음과 같이 Exception을 사용한다.

# try:
#     ...
# except Exception:       # 위험! 아래를 참조
#     print('An error occurred')
# 일반적으로, 코드를 이런 식으로 작성하는 것은 좋은 생각이 아니다. 실패 이유를 알 수 없기 때문이다.


## 오류를 붙잡는 잘못된 방식

In [None]:
# 오류를 붙잡는 잘못된 방식
# ------------------------
# 예외를 바람직하지 않은 방식으로 사용하는 예를 살펴보자.

# try:
#     go_do_something()
# except Exception:
#     print('Computer says no')

# 이렇게 하면 발생할 수 있는 모든 오류를 붙잡아 버리므로, 전혀 예상치 못한 이유로 문제가 생기는 경우(예: 파이썬 모듈을 설치하지 않았을 때 등) 디버깅이 불가능하다.

# 더 나은 방법
# ------------
# 모든 오류를 다 붙잡고 싶으면 다음과 같이 접근하는 것이 좋다.

# try:
#     go_do_something()
# except Exception as e:
#     print('Computer says no. Reason :', e)

# 이렇게 하면 실패한 이유를 구체적으로 보고한다. 
# 발생할 수 있는 모든 오류를 붙잡도록 코드를 작성할 때는 이와 같이 오류를 보고하는 메커니즘을 갖춰두는 것이 좋다.

# 더 좋은 방법은 오류의 범위를 좁히는 것이다. 실제로 처리할 수 있는 오류만 잡아라. 
# 처리할 수 없는 오류는 다른 코드에서 처리하게 내버려두라.

## 예외를 다시 일으키기

In [None]:
# 예외를 다시 일으키기
# -------------------
# 붙잡은 오류를 전파하려면 raise를 사용한다.

# try:
#     go_do_something()
# except Exception as e:
#     print('Computer says no. Reason :', e)
#     raise
# 이렇게 하면 행동을 취하고(예: 로깅) 호출자에게 오류를 전달할 수 있다.

## 예외 모범 사례

In [None]:
# 예외 모범 사례
# --------------
# 예외를 붙잡지 않는다. 일찍 큰 소리를 내며 실패한다. 
# 중요한 문제라면 다른 사람이 신경 써 줄 것이다. 
# 그렇게 해 줄 다른 사람이 없을 때만 예외를 붙잡아라. 회복해서 진행이 가능한 오류만 붙잡으라는 뜻이다.


# finally 문
# ----------
# 예외가 발생했는지의 여부와 관계 없이 실행해야 할 코드를 지정한다.

# lock = Lock()
# ...
# lock.acquire()
# try:
#     ...
# finally:
#     lock.release()  # 이것은 항상 실행된다! 예외 발생 여부와 관계 없이.
# 리소스를 안전하게 관리하기 위해 사용한다(잠금, 파일 등).


# with 문
# -------
# 요즘은 코드에서 try-finally를 with 문으로 대신하곤 한다.

# lock = Lock()
# with lock:
#     # 잠금을 획득
#     ...
# # 잠금 해제
# 좀 더 친숙한 예를 보자.

# with open(filename) as f:
#     # 파일을 사용
#     ...
# # 파일을 닫음

# with는 리소스 사용 콘텍스트(context)을 정의한다. 예외가 콘텍스트에서 벗어나면 리소스는 해제된다. 
# with 문은 해당 구문을 지원하도록 특별히 프로그래밍된 객체에 대해서만 작동한다.

## 연습 문제

### 연습 문제 3.8: 예외 일으키기

In [69]:
def parse_csv(filename, select=None, types=[str, int, float], has_headers=False, delimiter=','):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    #if bool(select) == bool(has_header)
    print('select:', bool(select))
    print('has_headers:', bool(has_headers))
    if select:
        if not has_headers:
            raise RuntimeError

portfolio = parse_csv('../../data/portfolio.csv')
print(portfolio)
portfolio = parse_csv('../../data/portfolio.csv', select=['name','shares'])
print(portfolio)
portfolio = parse_csv('../../data/portfolio.csv', has_headers=True)
print(portfolio)
portfolio = parse_csv('../../data/portfolio.csv', select=['name','shares'], has_headers=True)
print(portfolio)

select: False
has_headers: False
None
select: True
has_headers: False
None
select: False
has_headers: True
None
select: True
has_headers: True
None


In [80]:
# 지난 섹션에서 작성한 parse_csv() 함수는 사용자 정의 컬럼을 선택할 수 있게 해주지만, 
# 입력 데이터 파일에 컬럼 헤더가 있어야만 올바로 작동한다.

# select와 has_headers=False 인자가 함께 전달되는 경우 예외를 일으키게 코드를 수정해 보라. 예:

# >>> parse_csv('Data/prices.csv', select=['name','price'], has_headers=False)
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
#   File "fileparse.py", line 9, in parse_csv
#     raise RuntimeError("select argument requires column headers")
# RuntimeError: select argument requires column headers
# >>>

# fileparse.py
import csv

def parse_csv(filename, select=None, types=[str, int, float], has_headers=False, delimiter=','):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    if select:
        if not has_headers:
            raise RuntimeError('맞추어라 대가리를')

        
    with open(filename, 'r') as f:
        dell = ','
        rows = csv.reader(f, delimiter=delimiter)
        # rows = csv.reader(f, delimiter=' ')
        
        
        # 헤더(머리말)를 읽음
        if has_headers:
            headers = next(rows)
        else:
            headers = []
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for row in rows:
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            # 특정 컬럼이 선택되었으면 필터링 과 자료형 변환
            if indices:
                row = [ row[index] for index in indices ]
        
            if types:
                row = [func(val) for func, val in zip(types, row) ]

            # 딕셔너리를 만듦
            if has_headers:    
                record = dict(zip(headers, row))
            else:
                record = tuple(row)
            records.append(record)
    return records

# 일부 데이터만 읽기
portfolio = parse_csv('../../data/portfolio.dat', types=[str, int, float], has_headers=True, delimiter=' ')
print(portfolio)
print('-'*80)

try:
    portfolio = parse_csv('../../data/portfolio.dat', types=[str, int, float], has_headers=False, delimiter=' ')
except RuntimeError as e:
    print(e)

except ValueError as e:
    print(e)
    # print(portfolio)
    



# 이 검사 외에, 함수에서 또 다른 종류의 입력값 검사를 수행해야 하는 것은 아닌지 궁금할 것이다. 예를 들어, 파일명이 문자열인지, 타입이 리스트인지, 아니면 다른 것인지 확인해야 할까?

# 일반적인 규칙으로, 그러한 테스트를 건너뛰고, 잘못된 입력이 들어오면 프로그램이 실패하게 내버려두는 것이 최선일 때가 많다. 트레이스백 메시지가 문제를 지목하여 디버깅을 도와줄 것이다.

# 위에서 확인을 추가한 이유는 프로그램이 무의미하게 실행되는 것을 피하기 위해서다(예: 컬럼 헤더를 필요로 하는 기능을 사용함에도 불구하고, 그와 동시에 아무 헤더도 없다고 지정하는 것).

# 이는 호출하는 코드에 프로그래밍 오류가 있음을 가리킨다. "발생해서는 안 되는" 케이스를 검사하는 것은 좋은 생각이다.

[{'name': 'AA', 'shares': 100, 'price': 32.2}, {'name': 'IBM', 'shares': 50, 'price': 91.1}, {'name': 'CAT', 'shares': 150, 'price': 83.44}, {'name': 'MSFT', 'shares': 200, 'price': 51.23}, {'name': 'GE', 'shares': 95, 'price': 40.37}, {'name': 'MSFT', 'shares': 50, 'price': 65.1}, {'name': 'IBM', 'shares': 100, 'price': 70.44}]
--------------------------------------------------------------------------------
invalid literal for int() with base 10: 'shares'


### 연습 문제 3.9: 예외를 붙잡기

In [100]:
# 앞에서 작성한 parse_csv() 함수는 파일의 전체 내용을 처리하는 데 사용된다. 
# 하지만, 실제 세계에서는 입력 파일이 손상되거나, 값이 누락되거나, 오류 데이터가 섞여 있을 수 있다. 
# 다음과 같이 실험해보자.

# >>> portfolio = parse_csv('Data/missing.csv', types=[str, int, float])
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
#   File "fileparse.py", line 36, in parse_csv
#     row = [func(val) for func, val in zip(types, row)]
# ValueError: invalid literal for int() with base 10: ''
# >>>
# 레코드 생성 도중 발생한 모든 ValueError 예외를 붙잡아, 변환이 불가능한 행에 대해 경고 메시지를 프린트하도록 parse_csv() 함수를 수정하라.
# fileparse.py
import csv

def parse_csv(filename, select=None, types=[str, int, float], has_headers=False, delimiter=','):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    if select:
        if not has_headers:
            raise RuntimeError('맞추어라 대가리를')

    with open(filename, 'r') as f:
        dell = ','
        rows = csv.reader(f, delimiter=delimiter)
        # rows = csv.reader(f, delimiter=' ')
        
        
        # 헤더(머리말)를 읽음
        if has_headers:
            headers = next(rows)
        else:
            headers = []
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for i, row in enumerate(rows):
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            try:
                # 특정 컬럼이 선택되었으면 필터링 과 자료형 변환
                if indices:
                    row = [ row[index] for index in indices ]
            
                if types:
                    row = [func(val) for func, val in zip(types, row) ]
                    
            except ValueError as e:
                print(f"Row {i}: Couldn't convert [{row}]")
                print(f"Row {i}: Reason {e}")

            # 딕셔너리를 만듦
            if has_headers:    
                record = dict(zip(headers, row))
            else:
                record = tuple(row)
            records.append(record)
    return records

portfolio = parse_csv('../../data/missing.csv', types=[str, int, float])
print(portfolio)


# 메시지에 행 번호와 실패 이유를 나타내는 정보를 포함한다. 함수를 테스트하기 위해, 위의 Data/missing.csv 파일을 읽는다. 예:

# >>> portfolio = parse_csv('Data/missing.csv', types=[str, int, float])
# Row 4: Couldn't convert ['MSFT', '', '51.23']
# Row 4: Reason invalid literal for int() with base 10: ''
# Row 7: Couldn't convert ['IBM', '', '70.44']
# Row 7: Reason invalid literal for int() with base 10: ''
# >>>
# >>> portfolio
# [{'price': 32.2, 'name': 'AA', 'shares': 100}, {'price': 91.1, 'name': 'IBM', 'shares': 50}, {'price': 83.44, 'name': 'CAT', 'shares': 150}, {'price': 40.37, 'name': 'GE', 'shares': 95}, {'price': 65.1, 'name': 'MSFT', 'shares': 50}]
# >>>

Row 0: Couldn't convert [['name', 'shares', 'price']]
Row 0: Reason invalid literal for int() with base 10: 'shares'
Row 4: Couldn't convert [['MSFT', '', '51.23']]
Row 4: Reason invalid literal for int() with base 10: ''
Row 7: Couldn't convert [['IBM', '', '70.44']]
Row 7: Reason invalid literal for int() with base 10: ''
[('name', 'shares', 'price'), ('AA', 100, 32.2), ('IBM', 50, 91.1), ('CAT', 150, 83.44), ('MSFT', '', '51.23'), ('GE', 95, 40.37), ('MSFT', 50, 65.1), ('IBM', '', '70.44')]


### 연습 문제 3.10: 오류 억제

In [1]:
%%writefile ../../test_bed/fileparse.py
# 사용자가 명시적으로 원하는 경우 오류 메시지를 발생시키지 않게 parse_csv() 함수를 수정하라. 예:

# >>> portfolio = parse_csv('Data/missing.csv', types=[str,int,float], silence_errors=True)
# >>> portfolio
# [{'price': 32.2, 'name': 'AA', 'shares': 100}, {'price': 91.1, 'name': 'IBM', 'shares': 50}, {'price': 83.44, 'name': 'CAT', 'shares': 150}, {'price': 40.37, 'name': 'GE', 'shares': 95}, {'price': 65.1, 'name': 'MSFT', 'shares': 50}]

# fileparse.py
import csv

def parse_csv(filename, select=None, types=[str, int, float], has_headers=False, delimiter=',', silence_error=True):
    '''
    CSV 파일을 파싱해 레코드의 목록을 생성
    ''' 
    if select:
        if not has_headers:
            raise RuntimeError('맞추어라 대가리를')

    with open(filename, 'r') as f:
        dell = ','
        rows = csv.reader(f, delimiter=delimiter)
        # rows = csv.reader(f, delimiter=' ')
        
        
        # 헤더(머리말)를 읽음
        if has_headers:
            headers = next(rows)
        else:
            headers = []
        
        # 컬럼 선택기가 주어지면, 지정한 컬럼의 인덱스를 찾는다.
        # 또한 결과 딕셔너리에 사용할 헤더의 집합을 좁힌다
        if select:
            indices = [headers.index(colname) for colname in select]
            headers = select
        else:
            indices = []

        records = []

        for i, row in enumerate(rows):
            if not row:         # 데이터가 없는 행은 건너뜀
                continue

            try:
                # 특정 컬럼이 선택되었으면 필터링 과 자료형 변환
                if indices:
                    row = [ row[index] for index in indices ]
            
                if types:
                    row = [func(val) for func, val in zip(types, row) ]
                    
            except ValueError as e:
                if not silence_error:
                    print(f"Row {i}: Couldn't convert [{row}]")
                    print(f"Row {i}: Reason {e}")

            # 딕셔너리를 만듦
            if has_headers:    
                record = dict(zip(headers, row))
            else:
                record = tuple(row)
            records.append(record)
    return records

portfolio = parse_csv('../data/missing.csv', types=[str, int, float], silence_error=True)
print(portfolio)



# >>>
# 대부분의 프로그램에서 오류 처리는 가장 어려운 부분이다. 일반적인 규칙은 오류를 조용히 무시해 버리지 말라는 것이다. 그렇게 하는 것보다는, 문제를 보고하되 사용자가 원할 때에 한해 오류 메시지를 숨기는 것이 낫다.

Overwriting ../../test_bed/fileparse.py


# 3.4 모듈

## 모듈과 임포트

In [None]:
# 모듈과 임포트
# -------------
# 모든 파이썬 소스 파일은 모듈이다.

# # foo.py
# def grok(a):
#     ...
# def spam(b):
#     ...
# import 문은 모듈을 적재(load)하고 실행(execute)한다.

# # program.py
# import foo

# a = foo.grok(2)
# b = foo.spam('Hello')
# ...

## 네임스페이스

In [None]:
# 네임스페이스
# ------------
# 모듈은 이름이 있는 변수들의 컬렉션이며, 네임스페이스(namespace)라고 부르기도 한다. 
# 이름은 모두 글로벌 변수이며 함수는 소스 파일에 정의된다. 
# 임포트한 뒤, 모듈명은 프리픽스(prefix)로 사용된다. 네임스페이스라고 부르는 것은 그 때문이다.

# import foo

# a = foo.grok(2)
# b = foo.spam('Hello')
# ...

# 모듈명은 파일명과 직접 연관된다(foo -> foo.py).

## 글로벌 정의

In [None]:
# 글로벌 정의
# -----------
# 글로벌(global) 스코프에 정의된 모든 것은 모듈 네임스페이스에 존재한다. 같은 변수 x를 정의하는 두 모듈을 생각해 보자.

# # foo.py
# x = 42
# def grok(a):
#     ...

# # bar.py
# x = 37
# def spam(a):
#     ...

# 두 경우 x 정의는 서로 다른 변수를 참조한다. 하나는 foo.x이고, 다른 하나는 bar.x다. 서로 다른 모듈이 같은 이름을 사용할 수 있으며, 이때 이름은 서로 충돌하지 않는다.

# 모듈은 독립적이다(isolated).

## 환경으로서의 모듈

In [None]:
# 환경으로서의 모듈
# -----------------
# 모듈은 내부에 정의된 모든 코드를 감싸는 환경을 형성한다.

# # foo.py
# x = 42

# def grok(a):
#     print(x)

# 글로벌 변수들은 항상 감싸는 모듈(같은 파일)에 바인딩된다. 각 소스 파일은 개별적인 소우주다.

## 모듈 실행

In [None]:
# 모듈 실행
# ---------
# 모듈이 임포트될 때, 파일의 끝에 도달할 때까지 모듈의 모든 문장이 차례대로 실행된다. 
# 모듈 네임스페이스의 내용은 모두 글로벌 이름이며 실행 과정의 끝에 정의된다. 
# 글로벌 스코프에서 작업(프린팅, 파일 생성 등)을 수행하는 스크립팅 문장이 있다면, 
# 임포트할 때 수행되는 것을 볼 수 있을 것이다.

# import 모듈 as 문
# ------------
# 모듈을 임포트하면서 그 이름을 바꿔 사용할 수 있다.

# import math as m
# def rectangular(r, theta):
#     x = r * m.cos(theta)
#     y = r * m.sin(theta)
#     return x, y

# 그냥 임포트할 때와 똑같이 작동한다. 한 파일 내에서 모듈 이름을 바꿔 부를 뿐이다.


# from 모듈 import
# ----------------
# 다음과 같이 모듈에서 심볼을 선택해 로컬에서 사용할 수 있다.

# from math import sin, cos

# def rectangular(r, theta):
#     x = r * cos(theta)
#     y = r * sin(theta)
#     return x, y

# 이렇게 하면 모듈 프리픽스 없이도 모듈의 일부를 사용할 수 있다. 자주 사용하는 이름을 가져올 때 유용한 방식이다.


# 임포트에 대한 설명
# -----------------
# 임포트를 어떤 방식으로 사용하든, 모듈이 작동하는 방식은 달라지지 않는다.

# import math
# # vs
# import math as m
# # vs
# from math import cos, sin
# ...
# 특히, import는 항상 파일 전체를 실행시키며 모듈은 환경과 여전히 분리된다.

# import 모듈 as 문은 로컬의 이름만 바꾼다. from math import cos, sin 문은 여전히 math 모듈 전체를 적재한다. 이것을 수행하면 모듈에 있는 cos와 sin이 로컬 스페이스에 복사될 뿐이다.

## 모듈 적재

In [None]:
# 모듈 적재
# ---------
# 각 모듈은 단 한 번만 적재 및 실행된다. 참고: 임포트를 여러 번 하더라도 이전에 적재한 모듈의 레퍼런스를 반환한다.

# sys.modules은 적재된 모듈 전체의 딕셔너리다.

import sys
sys.modules.keys()
# ['copy_reg', '__main__', 'site', '__builtin__', 'encodings', 'encodings.encodings', 'posixpath', ...]

# 주의: 만약 모듈의 소스 코드를 변경한 후에 import 문을 수행하면 혼동이 생긴다. 
# 모듈을 임포트하면 sys.modules에 캐시되므로, 임포트를 여러 번 수행하면 이전에 적재된 모듈이 반환되며, 
# 모듈을 수정하더라도 반영되지 않는다. 수정한 모듈을 적재하는 가장 안전한 방법은 파이썬을 종료하고 다시 시작하는 것이다.

In [107]:
import sys
sys.path

sys.path.append('c:/temp/test')
sys.path

['c:\\Users\\User\\Quick_Ref\\Programming\\Python\\Python 중급\\실용 파이썬 프로그래밍',
 'c:\\Users\\User\\anaconda3\\python39.zip',
 'c:\\Users\\User\\anaconda3\\DLLs',
 'c:\\Users\\User\\anaconda3\\lib',
 'c:\\Users\\User\\anaconda3',
 '',
 'C:\\Users\\User\\AppData\\Roaming\\Python\\Python39\\site-packages',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages\\win32',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages\\win32\\lib',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages\\Pythonwin',
 'c:/temp/test']

In [115]:
%%writefile c:/temp/test/aa.py
def aa(a, b):
    print('a * b= ', a*b)

Overwriting c:/temp/test/aa.py


In [119]:
%%writefile c:/temp/test/aa.py
def aa(a, b, c):
    print('a * b * c= ', a*b*c)

Overwriting c:/temp/test/aa.py


In [118]:
%%writefile c:/temp/test/bb.py
import aa
aa.aa(3, 4)


Writing c:/temp/test/bb.py


## 모듈 위치

In [137]:
# 파이썬은 모듈을 찾을 때 경로 리스트(sys.path)를 참고한다.

import sys
sys.path
# [
#   '',
#   '/usr/local/lib/python36/python36.zip',
#   '/usr/local/lib/python36',
#   ...
# ]

# 현재 작업 디렉터리가 가장 먼저 온다.

['c:\\Users\\User\\Quick_Ref\\Programming\\Python\\Python 중급\\실용 파이썬 프로그래밍',
 'c:\\Users\\User\\anaconda3\\python39.zip',
 'c:\\Users\\User\\anaconda3\\DLLs',
 'c:\\Users\\User\\anaconda3\\lib',
 'c:\\Users\\User\\anaconda3',
 '',
 'C:\\Users\\User\\AppData\\Roaming\\Python\\Python39\\site-packages',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages\\win32',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages\\win32\\lib',
 'c:\\Users\\User\\anaconda3\\lib\\site-packages\\Pythonwin',
 'c:/temp/test',
 'c:/temp/test',
 '../../test_bed',
 '../../test_bed',
 '../../test_bed',
 '../../test_bed']

## 모듈 검색 경로

In [123]:
# 모듈 검색 경로
# --------------
# 언급한 바와 같이, sys.path에는 검색 경로가 있다. 필요한 경우 수작업으로 변경할 수 있다.

# 환경 변수를 통해 경로를 추가할 수도 있다.

# % env PYTHONPATH=/project/foo/pyfiles python3

# Python 3.6.0 (default, Feb 3 2017, 05:53:21)
# [GCC 4.2.1 Compatible Apple LLVM 8.0.0 (clang-800.0.38)]
# >>> import sys
# >>> sys.path
# ['','/project/foo/pyfiles', ...]

# 일반적으로, 모듈 검색 경로를 수작업으로 조정할 필요는 없다. 하지만, 일반적이지 않은 위치에 있다든지 현재 작업 디렉터리에서 액세스할 준비가 되지 않은 파이썬 코드를 임포트할 일이 생기곤 한다.

## 연습 문제

In [None]:
# 이 연습 문제는 모듈과 관련 있기 때문에, 파이썬을 적절한 환경에서 실행하는 것이 매우 중요하다. 
# 프로그래머들이 겪는 모듈과 관련된 문제는 대부분 현재 작업 디렉터리 또는 파이썬 경로 설정과 관련된다. 
# 이 코스에서는 작성하는 모든 코드가 Work/ 디렉터리에 있는 것으로 가정한다. 
# 최선의 결과를 얻으려면, 인터프리터도 그 디렉터리에서 실행하라. 
# 그렇게 하지 않으려면 sys.path에 practical-python/Work를 추가해야 한다.


### 연습 문제 3.11: 모듈 임포트

In [1]:
import sys
sys.path.append('../../test_bed')

In [12]:
# 섹션 3에서 우리는 CSV 데이터 파일의 내용을 파싱하는 범용 함수 parse_csv()를 작성했다.

# 이제 그 함수를 다른 프로그램에서 사용하는 법을 알아보자. 먼저, 새로운 셸 창을 시작한다. 파일이 있는 폴더로 이동한다. 그 파일들을 임포트할 것이다.

# 파이썬 상호작용 모드를 시작한다.

# bash % python3
# Python 3.6.1 (v3.6.1:69c0db5050, Mar 21 2017, 01:21:04)
# [GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin
# Type "help", "copyright", "credits" or "license" for more information.
# >>>
# 이전에 작성한 프로그램을 임포트해보자. 이전과 똑같이 출력이 표시된다. 모듈을 임포트하면 코드가 실행된다.

import bounce
# ... 출력을 보라 ...

import mortage
# ... 출력을 보라 ...

import report
# ... 출력을 보라 ...

# 위와 같이 작동하지 않는다면 파이썬을 잘못된 디렉터리에서 실행하고 있을 가능성이 높다. 이제 fileparse 모듈을 임포트하고 도움말을 표시해 보자.

import fileparse

#help(fileparse)
# ... 출력을 보라 ...

#dir(fileparse)
# ... 출력을 보라 ...
# >>>
# 이 모듈을 사용해 데이터를 읽는다.

portfolio = fileparse.parse_csv('../../data/portfolio.csv',select=['name','shares','price'], has_headers=True, types=[str,int,float])
portfolio
# ... 출력을 보라 ...

pricelist = fileparse.parse_csv('../../data/prices.csv',types=[str,float], has_headers=False)
pricelist
# ... 출력을 보라 ...

prices = dict(pricelist)
prices
# ... 출력을 보라 ...

prices['IBM']
# 106.11
# >>>
# 모듈 이름을 포함하지 않도록 함수를 임포트해 보자.

from fileparse import parse_csv
portfolio = parse_csv('../../data/portfolio.csv', select=['name','shares','price'], has_headers=True, types=[str,int,float])
portfolio
# ... 출력을 보라 ...
# >>>

[{'name': 'AA', 'shares': 100, 'price': 32.2},
 {'name': 'IBM', 'shares': 50, 'price': 91.1},
 {'name': 'CAT', 'shares': 150, 'price': 83.44},
 {'name': 'MSFT', 'shares': 200, 'price': 51.23},
 {'name': 'GE', 'shares': 95, 'price': 40.37},
 {'name': 'MSFT', 'shares': 50, 'price': 65.1},
 {'name': 'IBM', 'shares': 100, 'price': 70.44}]

### 연습 문제 3.12: 라이브러리 모듈 사용하기

In [12]:
# 섹션 2에서 다음과 같은 주식 보고서를 생성하는 report.py 프로그램을 작성했다.

#       Name     Shares      Price     Change
# ---------- ---------- ---------- ----------
#         AA        100       9.22     -22.98
#        IBM         50     106.28      15.18
#        CAT        150      35.46     -47.98
#       MSFT        200      20.89     -30.34
#         GE         95      13.48     -26.89
#       MSFT         50      20.89     -44.21
#        IBM        100     106.28      35.84
# 모든 입력 파일의 처리에 fileparse 모듈에 있는 함수를 사용하도록 프로그램을 수정하라. 이 작업 위해 fileparse를 모듈로서 임포트하고 read_portfolio() 와 read_prices() 함수에서 parse_csv() 함수를 사용하게 수정한다.

# 가격에 통화 기호($)를 포함해 다음과 같이 출력하게 수정해 보라.
import csv
import fileparse
from babel.numbers import format_currency

def make_header():
    headers = ('Name', 'Shares', 'Price', 'Change')

    for header in headers:
        print(f"{header:>10s} ", end='')
    print()
    for header in headers:
        print(f"{'-'*10:>10s} ", end='')
    print() 


def read_portfolio(filename):
    '''
    Read a stock portfolio file into a list of dictionaries with keys
    name, shares, and price.
    '''
    return fileparse.parse_csv(filename, select=['name','shares','price'], types=[str, int, float], has_headers=True)    


def read_prices(filename):
    '''
    Read a CSV file of price data into a dict mapping names to prices
    '''
    return dict(fileparse.parse_csv(filename, types=[str, float], has_headers=False))


def make_report_data(portfolio, prices):
    '''
    make a list of (name, shares, price, change) touples given a portfolio list and prices dictionary.
    '''
    report = []
    for stock in portfolio:
        current_price = prices[stock['name']]
        change = current_price - stock['price']
        summary = (stock['name'], stock['shares'], current_price, change)
        
        report.append(summary)
    return report    

def print_report(reportdata):
    '''
    Print a nicely formated table from a list of (name, shares, price, chang) tuple
    '''
    headers = ('Name', 'Shares', 'Price', 'Change')
    print('%10s %10s %10s %10s' %headers)
    print(('-'*10+' ')* len(headers))
    for row in reportdata:
        print('%10s %10d %10.2f %10.2f' % row)

def portfolio_report(portfoliofile, pricefile):
    '''
    Make a stock report given portfolio and price data files
    '''
    # Read data files
    portfolio = read_portfolio(portfoliofile)
    prices = read_prices(pricefile)
    
    # Create the report data
    report = make_report_data(portfolio, prices)
    
    # Print it out
    print_report(report)

portfolio_report('../../data/portfolio.csv', '../../data/prices.csv')
    
# prices = fileparse.parse_csv('../../data/prices.csv', types=[str, float])
# print('AA: ', prices)
# print('-'*80)

# # prices = read_prices('../../data/prices.csv')
# # print(prices)
# # print('-'*80)
# report = make_report(portfolio, prices)        
# print(report)

# make_header()
# for name, shares, price, change in report:
#     print(f"{name:>10s} {shares:>10d} {format_currency(price,'USD', locale='en_US'):>10s} {change:>10.2f}")

# 이 연습 문제의 처음에 예로 든 상호작용적인 예제를 참고하라. 수정 후에도 이전과 똑같이 출력되어야 한다.

      Name     Shares      Price     Change
---------- ---------- ---------- ---------- 
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84


### 연습 문제 3.14: 라이브러리 임포트를 더 많이 사용하기

In [13]:
import pcost

pcost.portfolio_cost('../../data/portfolio.csv')
# 44671.15

# report.read_portfolio() 함수를 사용하게 pcost.py 파일을 수정하라.

44671.15

# 3.5 메인 모듈

## 메인 함수

In [None]:
# 메인 함수
# ---------
# 여러 프로그래밍 언어에는 메인(main) 함수 또는 메서드 개념이 있다.

# // c / c++
# int main(int argc, char *argv[]) {
#     ...
# }
# // 자바
# class myprog {
#     public static void main(String args[]) {
#         ...
#     }
# }
# 이것은 애플리케이션을 시작할 때 처음 실행하는 함수다.

# 파이썬 메인 모듈
# ----------------
# 파이썬에는 메인 함수나 메서드가 없다. 그 대신 메인 모듈이 있다. 처음 실행하는 소스 파일이 메인 모듈이다.

# bash % python3 prog.py
# ...
# 인터프리터에 무엇을 전달하든, 그것이 메인 모듈이 된다. 이름이 무엇이든 상관없다.

# __main__ 확인
# -------------
# 모듈이 메인 스크립트로 작동하는지 알아보는 관례적인 방법이다.

# # prog.py
# ...
# if __name__ == '__main__':
#     # 메인 프로그램으로서 실행 ...
#     문장
#     ...
# 위 if 문에 속한 문장이 메인 프로그램이 된다.


## 메인 프로그램 vs. 라이브러리 임포트

In [None]:
# 메인 프로그램 vs. 라이브러리 임포트
# ----------------------------------
# 모든 파이썬 파일은 메인으로 실행하거나 라이브러리로서 임포트된다.

# bash % python3 prog.py # 메인으로서 실행
# import prog   # 라이브러리 임포트되어 실행
# 두 경우 모두 __name__은 모듈의 이름이다. 그러나 메인으로서 실행할 때만 __main__이 된다.

# 라이브러리 임포트로서 실행할 때는 메인 프로그램으로서 실행하는 문장을 실행하고 싶지 않을 수 있다. 
# 그러므로 어떤 쓰임새인지를 if로 검사하는 것이다.

# if __name__ == '__main__':
#     # 임포트될 때는 실행하지 않는다 ...


## 프로그램 템플릿

In [None]:
# 프로그램 템플릿
# ---------------
# 다음은 파이썬 프로그램을 작성하는 공통적인 프로그램 템플릿이다.

# # prog.py
# # Import 문(라이브러리)
# import modules

# # 함수
# def spam():
#     ...

# def blah():
#     ...

# # 메인 함수
# def main():
#     ...

# if __name__ == '__main__':
#     main()

## 명령행 도구

In [None]:
# 명령행 도구
# -----------
# 파이썬은 종종 명령행 도구로 사용된다.

# bash % python3 report.py portfolio.csv prices.csv
# 그 말은 스크립트를 셸 또는 터미널에서 실행한다는 뜻이다. 주용도는 자동화, 백그라운드 작업 등이다.



# 명령행 인자
# -----------
# 명령행은 텍스트 열의 리스트다.

# bash % python3 report.py portfolio.csv prices.csv
# 이러한 텍스트 열의 리스트를 sys.argv에서 찾을 수 있다.

# # 위 bash 명령에서
# sys.argv # ['report.py, 'portfolio.csv', 'prices.csv']
# 인자를 처리하는 간단한 예를 살펴보자.

# import sys

# if len(sys.argv) != 3:
#     raise SystemExit(f'Usage: {sys.argv[0]} ' 'portfile pricefile')
# portfile = sys.argv[1]
# pricefile = sys.argv[2]
# ...

## 표준 입출력

In [None]:
# 표준 입출력
# -----------
# 표준 입출력(stdio)은 일반 파일과 똑같이 작동하는 파일이다.

# sys.stdout
# sys.stderr
# sys.stdin

# print는 기본적으로 sys.stdout로 지정(direct)된다. 입력은 sys.stdin으로부터 읽는다. 
# 트레이스백(Traceback)과 오류(error)는 sys.stderr로 지정된다.

# stdio는 터미널, 파일, 파이프 등에 연결될 수 있다.

# bash % python3 prog.py > results.txt
# # 또는
# bash % cmd1 | python3 prog.py | cmd2

## 환경 변수(Environment Variable)

In [None]:
# 환경 변수(Environment Variable)
# -------------------------------
# 환경 변수는 셸에서 설정된다.

# bash % setenv NAME dave
# bash % setenv RSH ssh
# bash % python3 prog.py
# os.environ은 이러한 값을 담는 딕셔너리다.

# import os

# name = os.environ['NAME'] # 'dave'
# 변경은 프로그램이 나중에 실행시키는 서브프로세스에 반영된다.


## 프로그램 종료(Program Exit)

## 프로그램 종료(Program Exit)

In [None]:

# ---------------------------
# 프로그램 종료는 예외를 통해 처리된다.

# raise SystemExit
# raise SystemExit(exitcode)
# raise SystemExit('Informative message')

# 대안.

# import sys
# sys.exit(exitcode)
# 0이 아닌 종료 코드(exit code)는 오류를 나타낸다.


## #! 행

In [None]:
# #! 행
# 유닉스에서 #! 행은 스크립트를 파이썬으로서 실행할 수 있다. 다음과 같이 스크립트 파일 첫행에 추가한다.

# #!/usr/bin/env python3
# # prog.py
# ...
# 실행 권한이 필요하다.

# bash % chmod +x prog.py
# # Then you can execute
# bash % prog.py
# ... 출력 ...
# 참고: 윈도우의 Python Launcher도 언어 버전을 확인하기 위해 #! 행을 찾는다.



## 스크립트 템플릿

In [None]:
# 스크립트 템플릿
# ---------------
# 끝으로, 명령행 스크립트로서 실행되는 파이썬 프로그램을 위한 공통적인 코드 터미널이 있다.

# #!/usr/bin/env python3
# # prog.py

# # Import statements (libraries)
# import modules

# # Functions
# def spam():
#     ...

# def blah():
#     ...

# # 메인 함수
# def main(argv):
#     # 명령행 인자, 환경 변수 등을 파싱.
#     ...

# if __name__ == '__main__':
#     import sys
#     main(sys.argv)

## 연습 문제

### 연습 문제 3.15: main() 함수

In [None]:
# report.py 파일에 명령행 옵션의 리스트를 받아 이전과 같은 출력을 생성하는 main() 함수를 추가하자. 그것을 다음과 같이 상호작용적으로 실행할 수 있어야 한다.

# >>> import report
# >>> report.main(['report.py', 'Data/portfolio.csv', 'Data/prices.csv'])
#       Name     Shares      Price     Change
# ---------- ---------- ---------- ----------
#         AA        100       9.22     -22.98
#        IBM         50     106.28      15.18
#        CAT        150      35.46     -47.98
#       MSFT        200      20.89     -30.34
#         GE         95      13.48     -26.89
#       MSFT         50      20.89     -44.21
#        IBM        100     106.28      35.84
       

# 비슷한 main() 함수를 갖도록 pcost.py 파일을 수정하자.

# >>> import pcost
# >>> pcost.main(['pcost.py', 'Data/portfolio.csv'])
# Total cost: 44671.15
# >>>

In [4]:
%%writefile ../../test_bed/report.py
'''
Reporting Program Tools
'''
import csv
import fileparse
from babel.numbers import format_currency

def make_header():
    headers = ('Name', 'Shares', 'Price', 'Change')

    for header in headers:
        print(f"{header:>10s} ", end='')
    print()
    for header in headers:
        print(f"{'-'*10:>10s} ", end='')
    print() 


def read_portfolio(filename):
    '''
    Read a stock portfolio file into a list of dictionaries with keys
    name, shares, and price.
    '''
    return fileparse.parse_csv(filename, select=['name','shares','price'], types=[str, int, float], has_headers=True)    


def read_prices(filename):
    '''
    Read a CSV file of price data into a dict mapping names to prices
    '''
    return dict(fileparse.parse_csv(filename, types=[str, float], has_headers=False))


def make_report_data(portfolio, prices):
    '''
    make a list of (name, shares, price, change) touples given a portfolio list and prices dictionary.
    '''
    report = []
    for stock in portfolio:
        current_price = prices[stock['name']]
        change = current_price - stock['price']
        summary = (stock['name'], stock['shares'], current_price, change)
        
        report.append(summary)
    return report    

def print_report(reportdata):
    '''
    Print a nicely formated table from a list of (name, shares, price, chang) tuple
    '''
    headers = ('Name', 'Shares', 'Price', 'Change')
    print('%10s %10s %10s %10s' %headers)
    print(('-'*10+' ')* len(headers))
    for row in reportdata:
        print('%10s %10d %10.2f %10.2f' % row)


def portfolio_report(portfoliofile, pricefile):
    '''
    Make a stock report given portfolio and price data files
    '''
    # Read data files
    portfolio = read_portfolio(portfoliofile)
    prices = read_prices(pricefile)
    
    # Create the report data
    report = make_report_data(portfolio, prices)
    
    # Print it out
    print_report(report)


def main(args):
    if len(args) != 3:
        raise SystemExit('Usage: %s portfile pricefile' % args[0])
    
    portfolio_report(args[1], args[2])


if __name__ == '__main__':
    import sys
    main(sys.argv)

Overwriting ../../test_bed/report.py


In [1]:
import sys
sys.path.append('../../test_bed/')

In [2]:
import report

report.main(['report.py', '../../data/portfolio.csv', '../../data/prices.csv'])

      Name     Shares      Price     Change
---------- ---------- ---------- ---------- 
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84


In [3]:
%%writefile ../../test_bed/pcost.py
import report

def portfolio_cost(filename):
    '''포트폴리오 파일의 총 비용(주식수*가격)을 계산'''
    
    total_cost = 0.0
    
    portfolio = report.read_portfolio(filename)
    for stock in portfolio:
        nshares = stock['shares']
        price = stock['price']
        total_cost += nshares * price
        
    return total_cost


def main(args):
    if len(args) != 2:
        raise SystemExit('Usage: %s portfile' % args[0])
    
    print('Total cost: ', portfolio_cost(args[1])) 


if __name__ == '__main__':
    import sys
    main(sys.argv)

Overwriting ../../test_bed/pcost.py


In [1]:
import sys
sys.path.append('../../test_bed')

In [3]:
import pcost

pcost.main(['pcost.py','../../data/portfolio.csv'])

Total cost:  44671.15


### 연습 문제 3.16: 스크립트 만들기

In [None]:
report.py와 pcost.py 프로그램을 수정해 명령행에서 스크립트로서 실행할 수 있게 해 보자.

bash $ python3 report.py Data/portfolio.csv Data/prices.csv
      Name     Shares      Price     Change
---------- ---------- ---------- ----------
        AA        100       9.22     -22.98
       IBM         50     106.28      15.18
       CAT        150      35.46     -47.98
      MSFT        200      20.89     -30.34
        GE         95      13.48     -26.89
      MSFT         50      20.89     -44.21
       IBM        100     106.28      35.84

bash $ python3 pcost.py Data/portfolio.csv
Total cost: 44671.15

# 3.6 설계에 관한 논의

## 파일명 vs 이터러블

In [None]:
# 파일명 vs 이터러블
# -----------------
# 같은 출력을 반환하는 다음 두 프로그램을 비교해 보자.

# # 파일명을 제공
# ---------------
# def read_data(filename):
#     records = []
#     with open(filename) as f:
#         for line in f:
#             ...
#             records.append(r)
#     return records

# d = read_data('file.csv')


# # 행을 제공
# -----------
# def read_data(lines):
#     records = []
#     for line in lines:
#         ...
#         records.append(r)
#     return records

# with open('file.csv') as f:
#     d = read_data(f)

# 어느 함수를 선호하는가? 이유는?
# 이 함수 중 어느 것이 더 유연한가?


## 심오한 아이디어: "덕 타이핑"

In [None]:
# 심오한 아이디어: "덕 타이핑"
# ---------------------------
# 컴퓨터 프로그래밍에서 덕 타이핑(Duck Typing)이란, 
# 어떤 객체를 특정 목적으로 사용할 수 있는지 판단하는 것과 관련된 개념이다. 
# 덕 테스트(duck test)의 예를 들어 설명한다.

# 만약 어떤 것이 오리처럼 생겼고, 오리처럼 헤엄치고, 오리처럼 꽥꽥거린다면, 그것은 아마도 오리일 것이다.

# 위 read_data()의 두 번째 버전에서, 함수는 이터러블 객체를 예상한다. 파일의 행에 국한되지 않는다.

# def read_data(lines):
#     records = []
#     for line in lines:
#         ...
#         records.append(r)
#     return records

# 이는 우리가 다른 lines를 가지고 사용할 수 있음을 의미한다.
# --------------------------------------------------------

# # CSV 파일
# lines = open('data.csv')
# data = read_data(lines)

# # ZIP 압축된 파일
# lines = gzip.open('data.csv.gz','rt')
# data = read_data(lines)

# # 표준 입력
# lines = sys.stdin
# data = read_data(lines)

# # 문자열의 리스트
# lines = ['ACME,50,91.1','IBM,75,123.45', ... ]
# data = read_data(lines)
# 이 설계는 상당히 유연하다.

# 질문: 이러한 유연성을 환영해야 할까, 아니면 꺼려야 할까?

# 라이브러리 설계 모범 사례
# ------------------------
# 유연한 코드 라이브러리는 더 나은 서비스를 제공할 수 있다. 
# 옵션을 제한하지 말자. 
# 유연성이 높을수록 더 강력해진다.

## 연습 문제

### 연습 문제 3.17: 파일명에서 파일 비슷한 객체로

In [None]:
# 앞에서 parse_csv() 함수가 있는 fileparse.py 파일을 작성했다. 이 함수는 다음과 같이 작동한다.

# >>> import fileparse
# >>> portfolio = fileparse.parse_csv('Data/portfolio.csv', types=[str,int,float])

# 이 함수는 파일명이 전달될 것으로 예상한다. 
# 이 코드의 유연성을 좀 더 높이면 좋을 것이다. 
# 파일과 유사하거나 이터러블한 객체를 다룰 수 있게 함수를 수정해 보라. 예:

# >>> import fileparse
# >>> import gzip

# >>> with gzip.open('Data/portfolio.csv.gz', 'rt') as file:
# ...      port = fileparse.parse_csv(file, types=[str,int,float])
# ...

# >>> lines = ['name,shares,price', 'AA,100,34.23', 'IBM,50,91.1', 'HPE,75,45.1']
# >>> port = fileparse.parse_csv(lines, types=[str,int,float])

# 새로운 코드에 예전처럼 파일명을 전달하면 무슨 일이 일어나는가?

# >>> port = fileparse.parse_csv('Data/portfolio.csv', types=[str,int,float])
# >>> port
# ... 출력을 살펴보라(미쳤다) ...

# 그렇다. 조심해야 한다. 이런 일이 생기지 않게 안전 장치를 둘 수는 없을까?

In [10]:
import sys
sys.path.append('../../test_bed')

In [2]:
import fileparse
portfolio = fileparse.parse_csv('../../data/portfolio.csv', types=[str,int,float])
portfolio

[{'name': 'AA', 'shares': 100, 'price': 32.2},
 {'name': 'IBM', 'shares': 50, 'price': 91.1},
 {'name': 'CAT', 'shares': 150, 'price': 83.44},
 {'name': 'MSFT', 'shares': 200, 'price': 51.23},
 {'name': 'GE', 'shares': 95, 'price': 40.37},
 {'name': 'MSFT', 'shares': 50, 'price': 65.1},
 {'name': 'IBM', 'shares': 100, 'price': 70.44}]

In [16]:
%%writefile ../../test_bed/fileparse.py
#fileparse.py

import csv

def parse_csv(lines, select=None, types=None, has_headers=True, delimiter=',', silence_errors=False):
    '''
    Parse a CSV file into a list of records with type conveersion.
    ''' 
    if select and not has_headers:
        raise RuntimeError('select requires column headers')
    
    rows = csv.reader(lines, delimiter=delimiter)
    
    # Read the file headers (if any)
    headers = next(rows) if has_headers else []
    
    
    # If specific columns have been selected, make indices for filtering and set output columns
    if select:
        indices = [headers.index(colname) for colname in select]
        headers = select
    
    records = []

    for rowno, row in enumerate(rows, 1):
        if not row:
            continue
           
        # If specific column indices are selected, pick them out
        if select:
            row = [ row[index] for index in indices ]
    
        # Apply type conversion to the row
        if types:
            try:
                row = [ func(val) for func, val in zip(types, row) ]
            except ValueError as e:
                if not silence_errors:
                    print(f"Row {rowno}: Couldn't convert {row}")
                    print(f"Row {rowno}: Reason {e}")
                continue
    
        # Make a dictionary or a tuple
        if headers:    
            record = dict(zip(headers, row))
        else:
            record = tuple(row)
        records.append(record)
            
    return records

Overwriting ../../test_bed/fileparse.py


### 연습 문제 3.18: 기존 함수를 수정하기

In [None]:
# parse_csv()의 수정된 버전과 작동할 수 있게, report.py 파일의 read_portfolio()와 read_prices() 함수를 수정해 보라. 
# 코드를 조금만 고쳐야 한다. 
# 수정한 후에는 report.py와 pcost.py 프로그램이 이전과 같은 방식으로 작동해야 한다

In [17]:
%%writefile ../../test_bed/report.py
# report.py
'''
Reporting Program Tools
'''
import fileparse
from babel.numbers import format_currency


def read_portfolio(filename):
    '''
    Read a stock portfolio file into a list of dictionaries with keys
    name, shares, and price.
    '''
    with open(filename) as lines:
        return fileparse.parse_csv(lines, select=['name','shares','price'], types=[str, int, float])    


def read_prices(filename):
    '''
    Read a CSV file of price data into a dict mapping names to prices
    '''
    with open(filename) as lines:
        return dict(fileparse.parse_csv(lines, types=[str, float], has_headers=False))


def make_report_data(portfolio, prices):
    '''
    make a list of (name, shares, price, change) touples given a portfolio list and prices dictionary.
    '''
    rows = []
    for stock in portfolio:
        current_price = prices[stock['name']]
        change = current_price - stock['price']
        summary = (stock['name'], stock['shares'], current_price, change)
        rows.append(summary)
    return rows    


def print_report(reportdata):
    '''
    Print a nicely formated table from a list of (name, shares, price, chang) tuple
    '''
    headers = ('Name', 'Shares', 'Price', 'Change')
    print('%10s %10s %10s %10s' %headers)
    print(('-'*10+' ')* len(headers))
    for row in reportdata:
        print('%10s %10d %10.2f %10.2f' % row)


def portfolio_report(portfoliofile, pricefile):
    '''
    Make a stock report given portfolio and price data files
    '''
    # Read data files
    portfolio = read_portfolio(portfoliofile)
    prices = read_prices(pricefile)
    
    # Create the report data
    report = make_report_data(portfolio, prices)
    
    # Print it out
    print_report(report)


def main(args):
    if len(args) != 3:
        raise SystemExit('Usage: %s portfile pricefile' % args[0])
    
    portfolio_report(args[1], args[2])


if __name__ == '__main__':
    import sys
    main(sys.argv)

Overwriting ../../test_bed/report.py


In [18]:
%%writefile ../../test_bed/pcost.py
import report

def portfolio_cost(filename):
    '''
    Computes the total cost (shares*price) of a portfolio file
    '''
    portfolio = report.read_portfolio(filename)
    return sum(s['shares'] * s['price'] for s in portfolio)
    

def main(args):
    if len(args) != 2:
        raise SystemExit('Usage: %s portfile' % args[0])
    
    filename = args[1]
    print('Total cost: ', portfolio_cost(filename)) 


if __name__ == '__main__':
    import sys
    main(sys.argv)


Overwriting ../../test_bed/pcost.py


In [1]:
import sys
sys.path.append('../../test_bed')

In [2]:
# import fileparse
# portfolio = fileparse.parse_csv('../../data/portfolio.csv', types=[str,int,float])
# portfolio

# 이 함수는 파일명이 전달될 것으로 예상한다. 
# 이 코드의 유연성을 좀 더 높이면 좋을 것이다. 
# 파일과 유사하거나 이터러블한 객체를 다룰 수 있게 함수를 수정해 보라. 예:

import fileparse
import gzip

with gzip.open('../../data/portfolio.csv.gz', 'rt') as file:
    port = fileparse.parse_csv(file, types=[str,int,float])


#lines = ['name,shares,price', 'AA,100,34.23', 'IBM,50,91.1', 'HPE,75,45.1']
#port = fileparse.parse_csv(lines, types=[str,int,float])

[filename] <_io.TextIOWrapper name='../../data/portfolio.csv.gz' encoding='cp949'>


TypeError: expected str, bytes or os.PathLike object, not TextIOWrapper