# 7 사전

 * 사전(Dictionary)은 특정 키를 주면 이와 관련된 값을 돌려주는 내용 기반으로 검색하는 매핑형(mapping) 자료형이다. 
 * 사전은 임의 객체의 집합적 자료형인데, 데이터의 저장 순서가 없다. 
 * 매핑형에서는 키 (Key)를 이용해 값(Value)에 접근한다.


## 7.1 사전 만들기

사전을 만들기 위해서는 `{}` 혹은 `dict` 생성자를 이용할 수 있다.
빈 사전을 만드는 예는 아래와 같다.

In [1]:
# {} 이용하기
members = {}
members

{}

In [2]:
# dict 생성자 이용하기
dict()

{}

다음은 초기값이 주어진 사전을 만드는 예이다. `members`는 스포츠 게임 종목에 대한 참여 선수의 수이다.

In [3]:
# 방법1 - 가장 일반적임
members = {'basketball':5, 'soccer':11, 'baseball':9}
members

{'baseball': 9, 'basketball': 5, 'soccer': 11}

`dict`를 이용하면 다음과 같이 만들 수 있다. 단, 이 경우 키는 문자열인 경우만 사용 가능하다.

In [4]:
# 방법2
dict(basketball=5, soccer=11, baseball=9)

{'baseball': 9, 'basketball': 5, 'soccer': 11}

자료의 형을 확인해보자. `dict`는 사전형을 의미한다.

In [5]:
type(members)

dict

사전이 아닌 데이터로 부터 사전을 만들 수도 있다. 다음 예는 순서쌍으로 부터 사전 만드는 방법이다.

In [6]:
dict([('basketball', 5), ('soccer', 11), ('baseball', 9)])

{'baseball': 9, 'basketball': 5, 'soccer': 11}

### 7.1.1 실전 예

`ch07/simple_convnet.py`

In [7]:
class SimpleConvNet:
    def __init__(self, input_dim=(1, 28, 28), 
                 conv_param={'filter_num':30, 'filter_size':5, 'pad':0, 'stride':1},
                 hidden_size=100, output_size=10, weight_init_std=0.01):
        # 重みの初期化
        self.params = {}
        self.params['W1'] = weight_init_std * \
                            np.random.randn(filter_num, input_dim[0], filter_size, filter_size)
        self.params['b1'] = np.zeros(filter_num)
        self.params['W2'] = weight_init_std * \
                            np.random.randn(pool_output_size, hidden_size)
        self.params['b2'] = np.zeros(hidden_size)
        self.params['W3'] = weight_init_std * \
                            np.random.randn(hidden_size, output_size)
        self.params['b3'] = np.zeros(output_size)

## 7.2 사전 기본 연산

 * 사전은 세 개의 항목으로 구성
 * 각 항목은 키와 값으로 구성
 * 값을 꺼내려면 키를 사용
 * 값을 저장할 때도 키를 사용
 * 키가 사전에 등록되어 있지 않으면 새로운 항목이 만들어지며, 키가 이미 사전에 등록되어 있으면 이 키에 해당하는 값이 변경


In [8]:
members

{'baseball': 9, 'basketball': 5, 'soccer': 11}

In [9]:
members['baseball']   # 값 참조

9

In [10]:
members['volleyball'] = 7  #  새 값 설정
members['volleyball'] = 6  #  값 변경
members

{'baseball': 9, 'basketball': 5, 'soccer': 11, 'volleyball': 6}

`len`으로 항목의 수를 확인한다.

In [11]:
len(members)

4

`del` 문으로 항목을 삭제할 수 있다.

In [12]:
del members['basketball']
members

{'baseball': 9, 'soccer': 11, 'volleyball': 6}

멤버십 테스트 - 다음 `in` 연산자는 `'soccer'`가 키에 속하는지를 테스트 한다.

In [13]:
'soccer' in members

True

멤버에 속하지 않는 것을 테스트 하려면 `not in` 을 사용한다.

In [14]:
'soccer' not in members

False

## 7.3 리스트로 변환하기

 * 주요 메서드 : `keys( )와 values( ), items( )` 메서드는 키, 값, (키, 값)의 쌍 등의 데이터를 꺼낼 수 있게 해준다.
 * 이들이 되돌려주는 자료형은 뷰(view)라고 하는데 여기서 '뷰'란 사전 항목들을 동적으로 볼 수 있는 객체이다. 
 * 동적이란 의미는 사전의 내용이 바뀌어도 뷰를 통해서 내용의 변화를 읽어낼 수 있다는 의미이다.

In [15]:
members

{'baseball': 9, 'soccer': 11, 'volleyball': 6}

In [16]:
members.keys()   # 뷰 자료형을 리턴한다

dict_keys(['baseball', 'soccer', 'volleyball'])

In [17]:
list(members.keys())   # 리스트로 변환하려면 list 생성자를 이용한다

['baseball', 'soccer', 'volleyball']

In [18]:
list(members)   # 이렇게 해도 키 목록을 얻을 수 있다

['baseball', 'soccer', 'volleyball']

In [19]:
members.values()

dict_values([9, 11, 6])

In [20]:
members.items()

dict_items([('baseball', 9), ('soccer', 11), ('volleyball', 6)])

## 7.4 반복하기

사전은 여러 항목을 가지고 있는 자료형이므로 `for` 루프에 사용될 수 있다. 대표적인 사용 방법은 다음과 같이 사전 객체를 직접 `for` 문에 적용하는 것이다. 그러면 키에 대해서 루프가 실행된다.

In [21]:
for key in members:   # for key in members.keys(): 와 동일하다
    print (key, members[key])

baseball 9
soccer 11
volleyball 6


키와 값에 대해서 반복을 하려면 `items()` 메서드를 이용한다.

In [22]:
for key, value in members.items():
    print(key, value)

baseball 9
soccer 11
volleyball 6


## 7.5 키, 값

값은 임의의 객체가 될 수 있지만, 키는 해시 가능이고 변경 불가능한 자료형이어야 한다. 
예를 들어, 문자열과 숫자, 튜플은 키가 될 수 있지만, 리스트와 사전은 키가 될 수 없다.

 * 키 : 변경 가능하지 않은 객체(문자열, 튜플, 숫자등)
 * 값 : 임의의 객체

In [23]:
d = {}
d['one'] = 1
d[1] = 4
d[(1,2,3)] = 'tuple'

In [24]:
d[ [1,2,3] ] = 'list'

TypeError: unhashable type: 'list'

다음 예는 트위터에서 취한 예의 일부이다. 질의에 대한 답변으로 사전이 리턴되었다. 사전의 값으로 사용된 리스트 안에 또 다른 사전들이 열거되어 있음을 유의해서 보자.

In [25]:
trend = {
  "as_of": "2014-11-20T06:12:52Z",
  "trends": [
   {
    "query": "%23HappyBirthdayMichaelClifford",
    "name": "#HappyBirthdayMichaelClifford",
    "promoted_content": None,
    "url": "http://twitter.com/search?q=%23HappyBirthdayMichaelClifford"
   },
   {
    "query": "%23MTVStars",
    "name": "#MTVStars",
    "promoted_content": None,
    "url": "http://twitter.com/search?q=%23MTVStars"
   },
   {
    "query": "%23ThingsParentsSay",
    "name": "#ThingsParentsSay",
    "promoted_content": None,
    "url": "http://twitter.com/search?q=%23ThingsParentsSay"
   }]
}

항목이 두 개이고 다음의 두 키 값을 갖는다.

In [26]:
trend.keys()

dict_keys(['as_of', 'trends'])

`'as_of'` 키에 대한 값을 확인해보자.

In [27]:
trend['as_of']

'2014-11-20T06:12:52Z'

키 `'trends'`의 값은 사전의 리스트이다.

In [28]:
trend['trends']

[{'name': '#HappyBirthdayMichaelClifford',
  'promoted_content': None,
  'query': '%23HappyBirthdayMichaelClifford',
  'url': 'http://twitter.com/search?q=%23HappyBirthdayMichaelClifford'},
 {'name': '#MTVStars',
  'promoted_content': None,
  'query': '%23MTVStars',
  'url': 'http://twitter.com/search?q=%23MTVStars'},
 {'name': '#ThingsParentsSay',
  'promoted_content': None,
  'query': '%23ThingsParentsSay',
  'url': 'http://twitter.com/search?q=%23ThingsParentsSay'}]

첫 번째 사전 정보로 더 내려가 본다.

In [29]:
trend['trends'][0]

{'name': '#HappyBirthdayMichaelClifford',
 'promoted_content': None,
 'query': '%23HappyBirthdayMichaelClifford',
 'url': 'http://twitter.com/search?q=%23HappyBirthdayMichaelClifford'}

그 사전의 `'name'` 키 값이다.

In [30]:
trend['trends'][0]['name']

'#HappyBirthdayMichaelClifford'

## 7.6 사전의 메서드

다음은 사전의 메서드에 대하여
간략하게 요약한 것이다.

In [31]:
d = dict(one=1, two=2, three=3)
d

{'one': 1, 'three': 3, 'two': 2}

In [32]:
d.keys()  # 키 목록을 얻는다

dict_keys(['two', 'one', 'three'])

In [33]:
d.values()  # 값 목록을 얻는다

dict_values([2, 1, 3])

In [34]:
d.items()  # (키, 값) 쌍의 목록을 얻는다

dict_items([('two', 2), ('one', 1), ('three', 3)])

In [35]:
d.clear()  # 사전의 내용을 비운다
d

{}

In [36]:
d = dict(one=1, two=2, three=3)
d.copy()   # 사전을 복사한다

{'one': 1, 'three': 3, 'two': 2}

get 메서드는 키가 존재한다면 값을 꺼낸다.

In [37]:
d.get('one')

1

이 것은 다음과 같은 연산과 같다.

In [38]:
d['one']

1

하지만 존재하지 않는 키에 대해서는 KeyError가 발생한다.

In [39]:
d['four']

KeyError: 'four'

`get` 메서드는 키가 존재하지 않는 경우에 에러를 발생시키지 않고 `None` 값을 디폴트로 리턴한다.

In [40]:
d.get('four')

디폴트 값은 다음 인수로 지정해줄 수 있다.

In [41]:
d.get('four', '???')

'???'

사전이 변경되지는 않는다.

In [42]:
d

{'one': 1, 'three': 3, 'two': 2}

`setdefault` 메서드는 키가 없을 경우에 지정된 값을 되돌려주는 것은 `get`과 동일하지만 사전에 새로운 항목을 추가하는 것이 `get`과의 차이이다.

In [43]:
d.setdefault('four', '???')

'???'

In [44]:
d

{'four': '???', 'one': 1, 'three': 3, 'two': 2}

다른 사전에 있는 내용을 가져와서 갱신하려면 `update` 메서드를 이용한다.

In [45]:
extra = {'four':4, 'five':5}
d.update(extra)
d

{'five': 5, 'four': 4, 'one': 1, 'three': 3, 'two': 2}

`update` 메서드는 다음과 같은 튜플의 모임 자료도 받아들인다.

In [46]:
d.update([('six', 6), ('seven', 7)])

(키, 값) 튜플을 반환하고 사전에서 항목을 제거한다.

In [47]:
d.popitem()

('two', 2)

In [48]:
d

{'five': 5, 'four': 4, 'one': 1, 'seven': 7, 'six': 6, 'three': 3}

`fromkeys( )` 메서드는 클래스 메서드다. `seq`와 `value`를 이용하여 만든
새로운 사전을 반환한다.

In [49]:
dict.fromkeys('abce', 1)

{'a': 1, 'b': 1, 'c': 1, 'e': 1}

## 7.7 사전 내장(Dictionary comprehension)

사전 내장(Dictionary Comprehension)은 리스트 내장과 유사한 방식으로 동작하지만 사전을 만들어 낸다. 
사전 내장은 중괄호`{ }`를 사용하며 `키:값` 형식으로 항목을 표현한다.

In [50]:
{w:1 for w in 'abc'}

{'a': 1, 'b': 1, 'c': 1}

In [51]:
{e:e*e for e in range(10)}

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

In [52]:
{word:k+1 for k, word in enumerate('one two three four'.split())}

{'four': 4, 'one': 1, 'three': 3, 'two': 2}

## 7.8 순서를 유지하는 사전 - OrderedDict

만일 입력 순서를 기억해야 하는 사전이 필요하면 `collections` 모듈의 `OrderedDict` 사전을 사용할 수 있다. 이 자료형은 사전과 동일하게 동작하지만, 데이터가 추가된 순서를 기억하며 `for` 문 등으로 반복할 때 입력한 순서대로 처리된다. `popitem( )` 메서드는 맨 마지막 항목을 제거하며, `OrderedDict` 사전 만의 `move_to_end(key)` 메서드는 키 항목을 맨 뒤로 이동시킨다.


In [53]:
from collections import OrderedDict

In [54]:
d = OrderedDict()
d['one'] = 1
d['two'] = 2
d['three'] = 3
d['four'] = 4
d

OrderedDict([('one', 1), ('two', 2), ('three', 3), ('four', 4)])

대부분의 사전 메서드를 `OrderedDict`에서도 동일하게 사용할 수 있다.
항목 순서를 바꾸는 `move_to_end` 메서드도 준비되어 있다.

In [55]:
d.move_to_end('one') # 'one'을 맨 마지막으로 이동시킨다. 
d

OrderedDict([('two', 2), ('three', 3), ('four', 4), ('one', 1)])

### 7.8.1 실전 예

`ch07/simple_convnet.py`

In [56]:
class SimpleConvNet:
    """単純なConvNet

    conv - relu - pool - affine - relu - affine - softmax
    
    Parameters
    ----------
    input_size : 入力サイズ（MNISTの場合は784）
    hidden_size_list : 隠れ層のニューロンの数のリスト（e.g. [100, 100, 100]）
    output_size : 出力サイズ（MNISTの場合は10）
    activation : 'relu' or 'sigmoid'
    weight_init_std : 重みの標準偏差を指定（e.g. 0.01）
        'relu'または'he'を指定した場合は「Heの初期値」を設定
        'sigmoid'または'xavier'を指定した場合は「Xavierの初期値」を設定
    """
    def __init__(self, input_dim=(1, 28, 28), 
                 conv_param={'filter_num':30, 'filter_size':5, 'pad':0, 'stride':1},
                 hidden_size=100, output_size=10, weight_init_std=0.01):
        filter_num = conv_param['filter_num']
        filter_size = conv_param['filter_size']
        filter_pad = conv_param['pad']
        filter_stride = conv_param['stride']
        input_size = input_dim[1]
        conv_output_size = (input_size - filter_size + 2*filter_pad) / filter_stride + 1
        pool_output_size = int(filter_num * (conv_output_size/2) * (conv_output_size/2))

        # 重みの初期化
        ...
        
        # レイヤの生成
        self.layers = OrderedDict()
        self.layers['Conv1'] = Convolution(self.params['W1'], self.params['b1'],
                                           conv_param['stride'], conv_param['pad'])
        self.layers['Relu1'] = Relu()
        self.layers['Pool1'] = Pooling(pool_h=2, pool_w=2, stride=2)
        self.layers['Affine1'] = Affine(self.params['W2'], self.params['b2'])
        self.layers['Relu2'] = Relu()
        self.layers['Affine2'] = Affine(self.params['W3'], self.params['b3'])

        self.last_layer = SoftmaxWithLoss()
        
    def predict(self, x):
        for layer in self.layers.values():
            x = layer.forward(x)

        return x
        