## Chapter 3 딕셔너리와 집합
### 3.1 일반적인 매핑형

1. 공통적으로 사용되는 딕셔너리 메서드
2. 없는 키에 대한 특별 처리 
3. 표준 라이브러리에서 제공하는 다양한 딕셔너리 클래스
4. set과 frozenset형
5. 해시 테이블의 작동방식
6. 해시 테이블의 의미 (키 자료형 제한, 예측할 수 없는 순서)

매핑(mapping)은 키(key) 역할을 하는 데이터와 값(value) 역할을 하는 데이터를 하나씩 짝지어 저장하는 데이터 구조다. 
<br>키는 저장된 데이터를 구별하고 가리키는 데 쓰이고, 값은 그 키와 연결되어 저장된 데이터가 된다.
<br>시퀀스와 비교할 때 가장 큰 차이는 저장된 데이터를 가리킬 때 순서가 아니라 키를 이용한다는 점이다. 
<br>데이터를 저장할 때 순서보다 좀 더 의미 있는 식별 방법이 필요하다면 매핑을 사용하는 것이 좋다.

**collections.abc — Abstract Base Classes for Containers**
<br>This module provides abstract base classes that can be used to test whether a class provides a particular interface
<br>tuple과 dict에 대해 확장된 데이터 구조를 제공. named tuple, ordered dict, counter, default dict, deque
https://docs.python.org/3/library/collections.abc.html#collections.abc.Sequence

collections.abc 모듈은 dict 및 이와 유사한 자료형의 인터페이스를 정의하기 위해 Mapping 및 MutableMapping 추상 베이스 클래스(ABC)를 제공한다. 
* (이해) 자료형을 만들기 위해 abstract  base class를 지원한다 정도로 이해

특화된 매핑은 여기에 나온 추상 베이스 클래스 대신  dict나 collections.UserDict 클래스를 상속하기도 한다. 
* (이해) 다른 class 를 상속하는 경우도 있다 정도로 이해

추상 베이스 클래스는 매핑이 제공해야 하는 최소한의 인터페이스를 정의하고 문서화하기 위한 것이며 넓은 의미의 매핑을 지원해야 하는 코드에서 isinstance() 테스트를 하기 위한 기준으로 사용
* (이해) 넓은 의미의 매핑을 지원해야 하는..? isinstance() 테스트를 한다는 것은 해당 클래스인지 아닌지를 본다는건데.. 잘 모르겠다

In [75]:
my_dict = {}
import collections
isinstance(my_dict, collections.abc.Mapping)

True

**hash 함수**
<br> 임의의 길이를 갖는 임의의 데이터에 대해 고정된 길이의 데이터로 맵핑하는 함수, 같은 입력값에 대해 같은 출력이 보장됨

**hashable**
<br> 수명 주기 동안 결코 변하지 않는 해시값을 갖고 있고 (__hash__() 메서드가 필요)
<br> 다른 객체와 비교할 수 있으면 해시 가능 (__eq__() 메서드 필요)
* (이해) 해당 클래스에 \__hash__, \__eq__ 가 있어야 된다 정도로 이해

* (퍼실님 설명) hash란 건 별명이다. 변하면 hash를 보장할 수가 없는 거지

In [76]:
tt = (1, 2, (30, 40))
hash(tt)

8027212646858338501

In [83]:
t1 = (1, 2, [30, 40])
hash(t1) # list 자료구조에는 __hash__ 나 __eq__가 없나봄

TypeError: unhashable type: 'list'

In [84]:
tf = (1, 2, frozenset([30, 40])) # frozenset : set은 set인데 불변 set
hash(tf)

985328935373711578

기본적으로 객체의 해시값은 id()를 이용해서 구하므로 모든 객체가 서로 다르기 때문이다.
<br>Return the “identity” of an object. This is an integer which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same
* (이해) documentation을 봐도 identity가 뭔지 명확하지가 않다. 어떻게 생성되는 interger인 것인가

객체가 자신의 내부 상태를 평가해서 __eq__() 메써드를 직접 구현하는 경우에는 해시값 계산에 사용되는 속성이 모두 불변형일 때만 해시가능하다.
* (이해) __eq__를 직접 구현하는 경우는 어떤 경우를 말 하는지에 대한 이해가 필요하다

In [91]:
a = dict(one = 1, two = 2, three = 3)
b = {'one' : 1, 'two' : 2, 'three': 3}
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three' : 3, 'one' : 1, 'two' : 2})
a == b == c == d == e

True

* (퍼실님 설명) 같은 딕셔너린데, 표현을 달리하고 있는 것들이 있음. json이 dictionary type임. e번 같은 방식임.


### 3.2 지능형 딕셔너리

In [94]:
dial_codes = [
    (86, 'China'),
    (91, 'India'),
    (1, 'United States'),
    (62, 'Indonesia'),
    (55, 'Brazil'),
    (92, 'Pakistan'),
    (880, 'Bangladesh'),
    (234, 'Nigeria'),
    (7, 'Russia'),
    (81, 'Japan')
]
country_code = {country: code for code, country in dial_codes}
print(country_code)
print({code: country.upper() for country, code in country_code.items() if code < 66})

{'China': 86, 'India': 91, 'United States': 1, 'Indonesia': 62, 'Brazil': 55, 'Pakistan': 92, 'Bangladesh': 880, 'Nigeria': 234, 'Russia': 7, 'Japan': 81}
{1: 'UNITED STATES', 62: 'INDONESIA', 55: 'BRAZIL', 7: 'RUSSIA'}


### 3.3 공통적인 매핑 메서드

**duck typing**
<br>파이썬은 다형성 (polymorphism)을 느슨하게 구현했다. 이것은 클래스에 상관없이 같은 동작을 다른 객체에 적용할 수 있다. 

In [100]:
class Quote():
    def __init__(self, person, words):
        self.person = person
        self.words = words
    
    def who(self):
        return self.person
    
    def says(self):
        return self.words + '.'

class QuestionQuote(Quote): # 상속된 두 클래스에서는 초기화함수를 쓰지 않았다. 그러므로 부모의 __init__() 메써드를 오버라이드하지 않는다. 
    def says(self):
        return self.words + '?'
    
class ExclamationQuote(Quote): # 파이썬은 자동으로 부모 클래스(슈퍼 클래스)의 Quote의 __init__() 메써드를 호출해서 인스턴스 변수 person과 words를 저장한다. 
    def says(self):
        return self.words + '!' # 그러므로 서브 클래스 두 개에서 생성된 객체의 self.words에 접근할 수 있다.    

In [103]:
hunter = Quote('Elmer Fudd', "I'm hunting rabbits")
print(hunter.who(), 'says :', hunter.says())

hunted1 = QuestionQuote('Bugs Bunny', "What's up, doc")
print(hunted1.who(), 'says :', hunted1.says())

hunted2 = ExclamationQuote('Daffy Duck', "It's rabbit season")
print(hunted2.who(), 'says : ', hunted2.says()) # 세 개의 서로 다른 says() 메써드는 세 클래스에 대해 서로 다른 동작을 제공한다. 

Elmer Fudd says : I'm hunting rabbits.
Bugs Bunny says : What's up, doc?
Daffy Duck says :  It's rabbit season!


In [107]:
class BabblingBrook(): #  더 나아가 파이썬은 who()와 says() 메서드를 갖고 있는 모든 객체에서 이 메서드들을 실행할 수 있게 해준다. 
    def who(self):
        return 'Brook'
    
    def says(self):
        return 'Babble'
    
brook = BabblingBrook()
brook.says()

'Babble'

In [111]:
def who_says(obj):
    print(obj.who(), 'says', obj.says())

In [113]:
who_says(hunter)

who_says(hunted1)

who_says(hunted2)

who_says(brook)

Elmer Fudd says I'm hunting rabbits.
Bugs Bunny says What's up, doc?
Daffy Duck says It's rabbit season!
Brook says Babble


d.update(m, [**kargs]) 이 메서드가 m을 다루는 방식은 덕 타이핑의 대표적인 사례다.
* (이해) 도대체 왜 이게 덕 타이핑의 대표적인 사례인지 모르겠다.

m이 keys() 메서드를 갖고 있는지 확인한 후 만약 메서드를 갖고 있으면 매핑이라고 간주한다.
* (이해) dict 등 key가 있는 자료구조인지 확인한 후 라는 뜻?

keys() 메서드가 없으면 update() 메서드는 m의 항목들이 (키, 값) 쌍으로 되어 있다고 간주하고 m을 반복한다.


In [126]:
dict_exp = {'a' : 1, 'b' : 2, 'c' : 3}
m = {'d' : 4} 
dict_exp.update(m)
print(dict_exp)

{'a': 1, 'b': 2, 'c': 3, 'd': 4}


### 3.3.1 존재하지 않는 키를 setdefault()로 처리하기

* 파이썬의 변수 조회 순서 local > globas > builtin

* bulitin은 c로 개발되어 있어서 상속이 되지 않는다. 

In [8]:
class Duck():
    def __init__(self, input_name):
        self.hidden_name = input_name
    def get_name(self):
        print('inside the getter')  # 이 문장이 프린트되면서
        return self.hidden_name # 아마 여기서는 입력된 input 값이 나오겠지
    def set_name(self, input_name):
        print('inside the setter')
        self.hidden_name = input_name
    name = property(get_name, set_name)

In [12]:
bird = Duck('hoit')
bird.get_name()


inside the getter


'hoit'

In [15]:
bird.set_name('hoiiit')
bird.get_name()

inside the setter
inside the getter


'hoiiit'

In [20]:
bird.name

inside the getter


'hoiiit'

In [22]:
bird.name = 'hoiiiiiiiit'
bird.name

inside the setter
inside the getter


'hoiiiiiiiit'

In [72]:
class Circle():
    def __init__(self, radius):
        self.radius = radius

    def diameter(self):
        return 2 * self.radius
    
    def __str__(self):
        return str(self)
    
    def __len__(self):
        i = 0
        for i in [1,2,3]:
            i += 1
        return i
    
    def __eq__(self, k):
        return self.radius == k.radius

In [73]:
test1 = Circle(1)
test2 = Circle(1)
test1 == test2

True

In [44]:
test1 == test2

False