In [None]:
# 6. 제너레이터
# ------------
# 이터레이션(for 루프)은 파이썬의 가장 일반적인 프로그래밍 패턴이다. 
# 프로그램에서 리스트를 다루고, 파일을 읽고, 데이터베이스에 질의하는 등의 여러 가지 일에 이터레이션이 자주 사용된다. 
# 파이썬의 가장 큰 장점 중 하나가 바로 "제너레이터 함수"라는 형태로 이터레이션을 커스터마이즈하고 
# 새롭게 정의할 수 있는 능력이다. 
# 이 섹션은 이 주제를 다룬다. 끝으로, 실시간 스트리밍 데이터를 흥미로운 방식으로 처리하는 프로그램을 작성한다.

# 6.1 이터레이션 프로토콜
# 6.2 제너레이터를 사용해 이터레이션을 커스터마이즈하기
# 6.3 생산자/소비자 문제와 흐름
# 6.4 제너레이터 표현식

# 6.1 이터레이션 프로토콜

In [None]:
# 6.1 이터레이션 프로토콜
#-- --------------------
# 이 섹션은 이터레이션이 어떻게 작동하는지 살펴본다.



# 너도나도 이터레이션
# ------------------
# 온갖 객체들이 이터레이션을 지원한다.

# a = 'hello'
# for c in a: # a의 문자를 루핑
#     ...

# b = { 'name': 'Dave', 'password':'foo'}
# for k in b: # 딕셔너리 키를 루핑
#     ...

# c = [1,2,3,4]
# for i in c: # 리스트/튜플의 항목을 루핑
#     ...

# f = open('foo.txt')
# for x in f: # 파일의 행을 루핑
#     ...

## 이터레이션: 프로토콜

In [None]:
# 이터레이션: 프로토콜
# ------------------
# for 문을 생각해보자.

# for x in obj:
#     # 문장
# 내부적으로 어떻게 작동하는가?

# _iter = obj.__iter__()        # 이터레이터 객체를 얻음
# while True:
#     try:
#         x = _iter.__next__()  # 다음 항목을 얻음
#     except StopIteration:     # 남은 항목이 없음
#         break
#     # 문장 ...

# for 문에서 작동하는 모든 객체는 이러한 저수준 이터레이션 프로토콜을 구현한 것이다.

# 예제: 리스트에 대해 수작업으로 이터레이션.

# >>> x = [1,2,3]
# >>> it = x.__iter__()
# >>> it
# <listiterator object at 0x590b0>
# >>> it.__next__()
# 1
# >>> it.__next__()
# 2
# >>> it.__next__()
# 3
# >>> it.__next__()
# Traceback (most recent call last):
# File "<stdin>", line 1, in ? StopIteration
# >>>

In [4]:
x = [1, 2, 3]
it = x.__iter__()
it
it.__next__()
it.__next__()
it.__next__()
it.__next__()

StopIteration: 

## 이터레이션 지원하기

In [None]:
# 이터레이션 지원하기
# 이터레이션의 유용성을 이해한다면 스스로 작성한 객체도 이터레이션을 지원하게 하고 싶을 것이다. 
# 예를 들어, 다음과 같이 커스텀 컨테이너를 만들 수 있다.

# class Portfolio:
#     def __init__(self):
#         self.holdings = []

#     def __iter__(self):
#         return self.holdings.__iter__()
#     ...

# port = Portfolio()
# for s in port:
#     ...

## 연습 문제

## 연습 문제 6.1: 이터레이션 뜯어보기

In [None]:
# 연습 문제 6.1: 이터레이션 뜯어보기
# --------------------------------
# 다음 리스트를 생성한다.

# a = [1,9,4,25,16]
# 이 리스트에 대해 수작업으로 이터레이션을 수행하라. __iter__()를 호출해 이터레이터를 얻은 다음, __next__() 메서드를 호출해 다음 번 원소를 얻는다.

# >>> i = a.__iter__()
# >>> i
# <listiterator object at 0x64c10>
# >>> i.__next__()
# 1
# >>> i.__next__()
# 9
# >>> i.__next__()
# 4
# >>> i.__next__()
# 25
# >>> i.__next__()
# 16
# >>> i.__next__()
# Traceback (most recent call last):
#   File "<stdin>", line 1, in <module>
# StopIteration
# >>>

# 빌트인 함수 next()를 사용하면 이터레이터의 __next__() 메서드를 간편하게 호출할 수 있다. 파일을 가지고도 같은 일을 해 보자.

# >>> f = open('Data/portfolio.csv')
# >>> f.__iter__()    # 참고: 이것은 파일 자체를 반환함
# <_io.TextIOWrapper name='Data/portfolio.csv' mode='r' encoding='UTF-8'>
# >>> next(f)
# 'name,shares,price\n'
# >>> next(f)
# '"AA",100,32.20\n'
# >>> next(f)
# '"IBM",50,91.10\n'
# >>>
# 파일의 끝에 도달할 때까지 next(f)를 계속 호출하라. 무슨 일이 일어나는지 관찰하라.

In [18]:
a = [1,9,4,25,16]
a.__iter__()


<list_iterator at 0x28b64d8cbb0>

In [17]:
f = open('../../data/portfolio.csv')
f.__iter__()
next(f)
next(f)
next(f)


'"IBM",50,91.10\n'

## 연습 문제 6.2: 이터레이션을 지원하기

In [None]:
# 연습 문제 6.2: 이터레이션을 지원하기
# -----------------------------------
# 당신이 직접 만든 객체가 이터레이션을 지원하게 하고 싶을 때가 있다. 
# 기존 리스트나 다른 이터러블을 감싸는 객체를 만들었을 때가 특히 그렇다.
# 새 파일 portfolio.py에 다음 클래스를 정의하자.

# # portfolio.py

# class Portfolio:

#     def __init__(self, holdings):
#         self._holdings = holdings

#     @property
#     def total_cost(self):
#         return sum([s.cost for s in self._holdings])

#     def tabulate_shares(self):
#         from collections import Counter
#         total_shares = Counter()
#         for s in self._holdings:
#             total_shares[s.name] += s.shares
#         return total_shares

# 이 클래스는 리스트 주위에 계층을 덧씌우되, total_cost 프로퍼티와 같은 추가 메서드를 갖는다.

In [2]:
%%writefile ../../test_bed/portfolio.py
# portfolio.py
from collections import Counter

class Portfolio:
    def __init__(self, holdings):
        self._holdings = holdings
    
    
    @property
    def total_cost(self):
        return sum([ s.cost for s in self._holdings])
    
    def tabulate_shares(self):
        total_shares = Counter()
        for s in self._holdings:
            total_shares[s.name] += s.shares
        return total_shares

Writing ../../test_bed/portfolio.py


In [None]:
# report.py의 read_portfolio() 함수를 수정해 다음과 같은 Portfolio 인스턴스를 생성하게 하자.

# # report.py
# ...

# import fileparse
# from stock import Stock
# from portfolio import Portfolio

# def read_portfolio(filename):
#     '''
#     주식 포트폴리오 파일을 읽어 딕셔너리의 리스트를 생성.
#     name, shares, price를 키로 사용.
#     '''
#     with open(filename) as file:
#         portdicts = fileparse.parse_csv(file,
#                                         select=['name','shares','price'],
#                                         types=[str,int,float])

#     portfolio = [ Stock(d['name'], d['shares'], d['price']) for d in portdicts ]
#     return Portfolio(portfolio)
# ...
# report.py 프로그램을 실행해 보라. Portfolio 인스턴스가 이터러블하지 않다는 사실로 인해 요란하게 실패하는 모습을 보게 된다.

# >>> import report
# >>> report.portfolio_report('Data/portfolio.csv', 'Data/prices.csv')
# ... 충돌한다 ...

In [4]:
%%writefile ../../test_bed/report.py
# report.py

import fileparse
import stock
import prices
import tableformat
from portfolio import Portfolio


def read_portfolio(filename):
    '''
    Read a stock portfolio file into a list of dictionaries with keys
    name, shares, and price.
    '''
    with open(filename) as lines:
        # Convert Dictionary to Object     
        portdicts = fileparse.parse_csv(lines, select=['name','shares','price'], types=[str,int,float])
    
    portfolio = [ stock.Stock(d['name'], d['shares'], d['price']) for d in portdicts ]
    return Portfolio(portfolio)   

def read_prices(filename):
    '''
    Read a CSV file of price data into a dict mapping names to prices.
    '''
    with open(filename) as lines:
        return dict(fileparse.parse_csv(lines, types=[str,float], has_headers=False))

        # Convert Dictionary to Object     
        # portdicts = fileparse.parse_csv(lines, types=[str,float], has_headers=False)
        # return [ prices.Prices(d.name, d.price) for d in portdicts ]


def make_report_data(portfolio,prices):
    '''
    Make a list of (name, shares, price, change) tuples given a portfolio list
    and prices dictionary.
    '''
    rows = []
    for stock in portfolio:
        current_price = prices[stock.name]
        change = current_price - stock.price
        summary = (stock.name, stock.shares, current_price, change)
        rows.append(summary)
    return rows

def print_report(reportdata, formatter):
    '''
    Print a nicely formated table from a list of (name, shares, price, change) tuples.
    '''
    formatter.headings(['Name', 'Shares', 'Price', 'Change'])
        
    for name, shares, price, change in reportdata:
        rowdata = [ name, str(shares), f'{price:0.2f}', f'{change:0.2f}' ]
        formatter.row(rowdata)

def portfolio_report(portfoliofile, pricefile, fmt):        
    '''
    Make a stock report given portfolio and price data files.
    '''
    # Read data files 
    portfolio = read_portfolio(portfoliofile)
    prices = read_prices(pricefile)

    # Create the report data (보고서 데이터 생성)
    report = make_report_data(portfolio, prices)

    # Print it out
    formatter = tableformat.create_formatter(fmt)
    print_report(report, formatter)
    

def main(args):
    if len(args) != 4:
        raise SystemExit('Usage: %s portfile pricefile' % args[0])
    portfolio_report(args[1], args[2], args[3])

if __name__ == '__main__':
    import sys
    main(sys.argv)


Overwriting ../../test_bed/report.py


In [1]:
import sys
sys.path.append('../../test_bed')

In [3]:
import report
report.portfolio_report('../../data/portfolio.csv', '../../data/prices.csv', 'txt')

TypeError: 'Portfolio' object is not iterable

In [None]:
# Portfolio 클래스가 이터레이션을 지원하게 수정해서 문제를 해결해 보자.

# class Portfolio:

#     def __init__(self, holdings):
#         self._holdings = holdings

#     def __iter__(self):
#         return self._holdings.__iter__()

#     @property
#     def total_cost(self):
#         return sum([s.shares*s.price for s in self._holdings])

#     def tabulate_shares(self):
#         from collections import Counter
#         total_shares = Counter()
#         for s in self._holdings:
#             total_shares[s.name] += s.shares
#         return total_shares

# 이렇게 수정하고 나면 report.py 프로그램이 다시 잘 작동할 것이다. 


In [5]:
%%writefile ../../test_bed/portfolio.py
# portfolio.py
from collections import Counter

class Portfolio:
    def __init__(self, holdings):
        self._holdings = holdings
    
    def __iter__(self):
        return self._holdings.__iter__()
    
    @property
    def total_cost(self):
        return sum([ s.cost for s in self._holdings])
    
    def tabulate_shares(self):
        total_shares = Counter()
        for s in self._holdings:
            total_shares[s.name] += s.shares
        return total_shares


Overwriting ../../test_bed/portfolio.py


In [2]:
import report
report.portfolio_report('../../data/portfolio.csv', '../../data/prices.csv', 'txt')

      Name     Shares      Price     Change 
---------- ---------- ---------- ---------- 
        AA        100       9.22     -22.98 
       IBM         50     106.28      15.18 
       CAT        150      35.46     -47.98 
      MSFT        200      20.89     -30.34 
        GE         95      13.48     -26.89 
      MSFT         50      20.89     -44.21 
       IBM        100     106.28      35.84 


In [None]:

# pcost.py 프로그램이 새로운 Portfolio 객체를 사용하게 수정하자. 이렇게 말이다.

# # pcost.py

# import report

# def portfolio_cost(filename):
#     '''
#     포트폴리오 파일의 총 비용(주식 수 * 가격)을 계산
#     '''
#     portfolio = report.read_portfolio(filename)
#     return portfolio.total_cost
# ...
# 잘 작동하는지 시험해 보자.

# >>> import pcost
# >>> pcost.portfolio_cost('Data/portfolio.csv')
# 44671.15
# >>>

In [5]:
%%writefile ../../test_bed/pcost.py

# pcost.py
import report

def portfolio_cost(filename):
    '''
    Computes the total cost (shares*price) of a portfolio file
    '''
    portfolio = report.read_portfolio(filename)
    return portfolio.total_cost


def main(args):
    if len(args) != 2:
        raise SystemExit('Usage: %s portfile' % args[0])
    
    filename = args[1]
    print('Total cost: ', portfolio_cost(filename)) 

if __name__ == '__main__':
    import sys
    main(sys.argv)


SystemExit: Usage: c:\Users\User\anaconda3\lib\site-packages\ipykernel_launcher.py portfile

In [6]:
import pcost

pcost.portfolio_cost('../../data/portfolio.csv')

44671.15

## 연습 문제 6.3: 더 적절한 컨테이너 만들기

In [None]:
# 연습 문제 6.3: 더 적절한 컨테이너 만들기
# ----------------------------------------
# 컨테이너 클래스를 만들다 보면 이터레이션 외에도 넣고 싶은 기능이 더 있을 것이다. 
# Portfolio 클래스를 다음과 같이 수정해 특수 메서드를 추가해 보자.

# class Portfolio:
#     def __init__(self, holdings):
#         self._holdings = holdings

#     def __iter__(self):
#         return self._holdings.__iter__()

#     def __len__(self):
#         return len(self._holdings)

#     def __getitem__(self, index):
#         return self._holdings[index]

#     def __contains__(self, name):
#         return any([s.name == name for s in self._holdings])

#     @property
#     def total_cost(self):
#         return sum([s.shares*s.price for s in self._holdings])

#     def tabulate_shares(self):
#         from collections import Counter
#         total_shares = Counter()
#         for s in self._holdings:
#             total_shares[s.name] += s.shares
#         return total_shares
# 새 클래스를 가지고 실험을 해 보자.

# >>> import report
# >>> portfolio = report.read_portfolio('Data/portfolio.csv')
# >>> len(portfolio)
# 7
# >>> portfolio[0]
# Stock('AA', 100, 32.2)
# >>> portfolio[1]
# Stock('IBM', 50, 91.1)
# >>> portfolio[0:3]
# [Stock('AA', 100, 32.2), Stock('IBM', 50, 91.1), Stock('CAT', 150, 83.44)]
# >>> 'IBM' in portfolio
# True
# >>> 'AAPL' in portfolio
# False
# >>>
# 이와 관련해 중요한 점을 관찰할 수 있다. 
# 코드가 파이썬에서 공통적으로 사용되는 어휘를 말한다면 '파이썬다운(Pythonic)' 것으로 간주된다. 
# 컨테이너 객체를 파이썬답게 만들려면 이터레이션, 인덱싱, containment, 기타 연산자를 지원하는 것이 중요하다.

In [10]:
%%writefile ../../test_bed/portfolio.py
# portfolio.py
from collections import Counter

class Portfolio:
    def __init__(self, holdings):
        self._holdings = holdings
    
    def __iter__(self):
        return self._holdings.__iter__()
    
    def __len__(self):
        return len(self._holdings)
    
    def __getitem__(self, index):
        return self._holdings[index]
    
    def __contains__(self, name):
        return any([ s.name == name for s in self._holdings ])
    
    @property
    def total_cost(self):
        return sum([ s.cost for s in self._holdings])
    
    def tabulate_shares(self):
        total_shares = Counter()
        for s in self._holdings:
            total_shares[s.name] += s.shares
        return total_shares


Overwriting ../../test_bed/portfolio.py


In [1]:
import sys
sys.path.append('../../test_bed')

In [7]:
import report

portfolio = report.read_portfolio('../../data/portfolio.csv')
len(portfolio)

portfolio[0]
portfolio[1]
portfolio[0:3]
'IBM' in portfolio
'AAPL' in portfolio

False