## 5.5.3. Implementing the Map Abstract Data Type
## 5.5.3 맵 추상 데이터 타입 구현하기
* One of the most useful Python collections is the dictionary. 
* 파이선의 가장 사용하기 좋은 컬렉션중 하나는 Dictionary이다.
* Recall that a dictionary is an associative data type where you can store key–data pairs.
* 딕셔너리 형은 키-데이터 쌍의 연관있는 데이터 유형임을 기억해라.
* The key is used to look up the associated data value. We often refer to this idea as a map.
* 키는 연관되어 있는 데이터 값을 찾기 위해 사용된다. 우리는 종종 이것을 map이라고 말하기도 한다.

* The map abstract data type is defined as follows. 
* map 추상 데이터 타입은 아래와 같이 정의된다.
* The structure is an unordered collection of associations between a key and a data value. 
* 구조는 키와 데이터 쌍으로 연결된 정렬되지 않은 컬렉션이다.
* The keys in a map are all unique so that there is a one-to-one relationship between a key and a value. 
* 맵 안에 있는 키들은 모두 유일하며, 키와 값의 관계는 1대1관계이다.
* The operations are given below.
* 오퍼레이션은 다음과 같다

* Map() Create a new, empty map. It returns an empty map collection.
* Map() 는 새로운, 비어있는 맵을 만든다, 이것은 빈 맵 컬렉션을 반환한다.
* put(key,val) Add a new key-value pair to the map. If the key is already in the map then replace the old value with the new value.
* put(key,val)은 새로운 키 밸류 쌍을 맵에 추가한다. 만약 키가 이미 존재한다면 이전 값을 새로운 값으로 바꾼다.
* get(key) Given a key, return the value stored in the map or None otherwise.
* get(key) 는 주어진 키에 맞는 값을 반환하거나, 없으면 None을 반환한다.
* del Delete the key-value pair from the map using a statement of the form del map[key].
* del은 키밸류 쌍을 맵에서 지운다
* len() Return the number of key-value pairs stored in the map.
* len()은 맵에 저장되어있는 키-밸류 쌍의 저장된 수를 반환한다
* in Return True for a statement of the form key in map, if the given key is in the map, False otherwise.
* in은 맵에 해당하는 key가 있다면 True를 반환한다. 그렇지 않다면 False를 반환한다.

* One of the great benefits of a dictionary is the fact that given a key, we can look up the associated data value very quickly. 
* 딕셔너리의 큰 강점중 하나는 주어진 키를 통해 연관된 데이터를 매우 빠르게 찾을수 있는 것이다.
* In order to provide this fast look up capability, we need an implementation that supports an efficient search. 
* 빠르게 찾아볼 수 있는 능력을 통해, 우리는 효율적인 탐색을 구현할 것이다.
* We could use a list with sequential or binary search but it would be even better to use a hash table as described above since looking up an item in a hash table can approach O(1) performance.
* 우리는 리스트를 사용해 순차적이나, 이진 탐색을 구현했지만 hash table을 사용하여 위에 나와있는 것 처럼 찾는것을 구현한다면, O(1)의 속도로 해시 테이블에 접근할 수 있다.

* In Listing 2 we use two lists to create a HashTable class that implements the Map abstract data type.
* 리스팅 2에서 두개의 리스트를 사용해 해시테이블 클래스를 만들고, Map 추상 데이터 타입을 구현하는 것을 볼수있다.
* One list, called slots, will hold the key items and a parallel list, called data, will hold the data values.
* 슬롯으로 불리는 하나의 리스트는 키를 저장할 것이다. 그리고 병렬 리스트인 데이터는 데이터 값을 들고 있을 것이다.
* When we look up a key, the corresponding position in the data list will hold the associated data value. 
* 우리가 키를 찾을때 대응하는 위치의 데이터가 데이터 값을 갖고 있을 것이다.
* We will treat the key list as a hash table using the ideas presented earlier.
* 우리는 이전에 설명한 아이디어 들로 키를 해시 테이블에서 다룰 것이다.
* Note that the initial size for the hash table has been chosen to be 11.
* 해시 테이블의 최초 사이즈로는 11을 정할 것이다.
* Although this is arbitrary, it is important that the size be a prime number so that the collision resolution algorithm can be as efficient as possible.
* 비록 이것이 임의의 숫자이지만 사이즈는 소수여야하고, 충돌 해결 알고리즘이 최대한 효율적이여야 한다.

In [11]:
# Listing 2

class HashTable:
    def __init__(self):
        self.size = 11
        self.slots = [None] * self.size
        self.data = [None] * self.size

* hashfunction implements the simple remainder method.
* 해시 펑션은 단순한 remainder 메소드를 통해 구현할 것이다.
* The collision resolution technique is linear probing with a “plus 1” rehash function.
* 충돌 해결 테크닉은 선형탐색에서 +1 재 해싱 펑션을 사용해 할것이다.
* The put function (see Listing 3) assumes that there will eventually be an empty slot unless the key is already present in the self.slots. 
* put 펑션은 비어있는 슬롯이 있을거라고 가정한다. (키가 self.slot에 이미 있다고 해도)
* It computes the original hash value and if that slot is not empty, iterates the rehash function until an empty slot occurs. 
* 이것은 원래의 해시 값을 계산하고, 슬롯이 비어지 않으면 리해시 펑션을 반복해 비어있는 슬롯이 나올때까지 반복한다.
* If a nonempty slot already contains the key, the old data value is replaced with the new data value. 
* 만약 비어있지 않은 슬롯이 키를 가지고 있다면, 이전 데이터 값은 새로운 데이터 값으로 변경된다.
* Dealing with the situation where there are no empty slots left is an exercise.
* 비어있는 슬롯이 없는 상황을 다루는 것은 연습문제로 두었다

In [12]:
# Listing 3

def put(self,key,data):
    hashvalue = self.hashfunction(key,len(self.slots))

    if self.slots[hashvalue] == None:
        self.slots[hashvalue] = key
        self.data[hashvalue] = data
    else:
        if self.slots[hashvalue] == key:
            self.data[hashvalue] = data  #replace
        else:
            nextslot = self.rehash(hashvalue,len(self.slots))
            while self.slots[nextslot] != None and \
                      self.slots[nextslot] != key:
                nextslot = self.rehash(nextslot,len(self.slots))

            if self.slots[nextslot] == None:
                self.slots[nextslot]=key
                self.data[nextslot]=data
            else:
                self.data[nextslot] = data #replace

def hashfunction(self,key,size):
     return key%size

def rehash(self,oldhash,size):
    return (oldhash+1)%size

* Likewise, the get function (see Listing 4) begins by computing the initial hash value.
* 이와같이, get 펑션은 처음 해시 값을 계산하는 것부터 시작한다.
* If the value is not in the initial slot, rehash is used to locate the next possible position. 
* 만약 값이 최초 슬롯에 없다면, 다음 가능한 위치를 가리키기 위해 리해싱 한다.
* Notice that line 15 guarantees that the search will terminate by checking to make sure that we have not returned to the initial slot. 
* 15라인은 최초 슬롯에 돌아갔는지 체크하여 탐색을 종료하는것을 보증한다.
* If that happens, we have exhausted all possible slots and the item must not be present.
* 만약 이것이 일어난다면, 모든 가능한 슬롯을 사용하고 아이템은 없어야 한다.
* The final methods of the HashTable class provide additional dictionary functionality. 
* 해시 테이블의 마지막 메서드는 추가적인 사전적 기능이다.
* We overload the __getitem__ and __setitem__ methods to allow access using``[]``. 
* 우리는 getitem과 setitem을 구현하여 [] 을 사용해 접근 가능하게 해준다.
* This means that once a HashTable has been created, the familiar index operator will be available. 
* We leave the remaining methods as exercises.
* 이것은 해시 테이블이 만들어질때, 친근한 인덱스 오퍼레이터를 사용할수 있도록 해준다.
* 우리는 남은 메서드를 연습문제로 남겨두었다.

In [13]:
# Listing 4
def get(self,key):
    startslot = self.hashfunction(key,len(self.slots))

    data = None
    stop = False
    found = False
    position = startslot
    while self.slots[position] != None and  \
                       not found and not stop:
        if self.slots[position] == key:
            found = True
            data = self.data[position]
        else:
            position=self.rehash(position,len(self.slots))
            if position == startslot:
                stop = True
    return data

def __getitem__(self,key):
    return self.get(key)

def __setitem__(self,key,data):
    self.put(key,data)

* The following session shows the HashTable class in action.
* 다음 세션은 해시 테이블 클래스를 나타낸다.
* First we will create a hash table and store some items with integer keys and string data values.
* 먼저 우리는 해시 테이블을 만들고 정수형 키와 문자열 데이터로 이뤄진 몇몇 아이템을 저장해 둘것이다.

In [19]:
H=HashTable()
H[54]="cat"
H[26]="dog"
H[93]="lion"
H[17]="tiger"
H[77]="bird"
H[31]="cow"
H[44]="goat"
H[55]="pig"
H[20]="chicken"
H.slots
H.data

['bird',
 'goat',
 'pig',
 'chicken',
 'dog',
 'lion',
 'tiger',
 None,
 None,
 'cow',
 'cat']

* Next we will access and modify some items in the hash table.
* 다음으로, 우리는 몇몇 아이템에 접근해 수정할 것이다.
* Note that the value for the key 20 is being replaced.
* 20으로 된 키가 교체되는것을 주의해라

In [20]:
H[20]
H[17]
H[20]='duck'
H[20]
H.data
print(H[99])

None


* The complete hash table example can be found in ActiveCode 1.
* 완전한 해시 테이블의 예제는 ActiveCode 1에 있다.

In [17]:
class HashTable:
    def __init__(self):
        self.size = 11
        self.slots = [None] * self.size
        self.data = [None] * self.size

    def put(self,key,data):
        hashvalue = self.hashfunction(key,len(self.slots))

        if self.slots[hashvalue] == None:
            self.slots[hashvalue] = key
            self.data[hashvalue] = data
        else:
            if self.slots[hashvalue] == key:
                self.data[hashvalue] = data  #replace
            else:
                nextslot = self.rehash(hashvalue,len(self.slots))
                while self.slots[nextslot] != None and \
                          self.slots[nextslot] != key:
                    nextslot = self.rehash(nextslot,len(self.slots))
            if self.slots[nextslot] == None:
                self.slots[nextslot]=key
                self.data[nextslot]=data
            else:
                self.data[nextslot] = data #replace

    def hashfunction(self,key,size):
         return key%size

    def rehash(self,oldhash,size):
        return (oldhash+1)%size

    def get(self,key):
        startslot = self.hashfunction(key,len(self.slots))

        data = None
        stop = False
        found = False
        position = startslot
        while self.slots[position] != None and  \
                           not found and not stop:
            if self.slots[position] == key:
                found = True
                data = self.data[position]
            else:
                position=self.rehash(position,len(self.slots))
                if position == startslot:
                    stop = True
        return data

    def __getitem__(self,key):
        return self.get(key)

    def __setitem__(self,key,data):
        self.put(key,data)

H=HashTable()
H[54]="cat"
H[26]="dog"
H[93]="lion"
H[17]="tiger"
H[77]="bird"
H[31]="cow"
H[44]="goat"
H[55]="pig"
H[20]="chicken"
print(H.slots)
print(H.data)

print(H[20])

print(H[17])
H[20]='duck'
print(H[20])
print(H[99])


[77, 44, 55, 20, 26, 93, 17, None, None, 31, 54]
['bird', 'goat', 'pig', 'chicken', 'dog', 'lion', 'tiger', None, None, 'cow', 'cat']
chicken
tiger
duck
None
