# 10. Dictionaries

## 10.1. A dictionary is a mapping

In [1]:
lst = ['zero', 'one', 'two']

In [2]:
lst[1]

'one'

In [3]:
numbers = {}
numbers

{}

In [4]:
numbers['zero'] = 0

In [5]:
numbers

{'zero': 0}

In [6]:
numbers['one'] = 1
numbers['two'] = 2
numbers

{'zero': 0, 'one': 1, 'two': 2}

In [7]:
numbers['two']

2

In [8]:
numbers['three']

KeyError: 'three'

In [9]:
len(numbers)

3

## 10.2. Creating dictionaries

In [10]:
numbers = {'zero': 0, 'one': 1, 'two': 2}

In [11]:
empty = dict()
empty

{}

In [12]:
numbers_copy = dict(numbers)
numbers_copy

{'zero': 0, 'one': 1, 'two': 2}

## 10.3. The in operator

In [13]:
'one' in numbers

True

In [14]:
1 in numbers

False

In [15]:
1 in numbers.values()

True

In [16]:
word_list = open('words.txt', encoding='utf-8').read().split()
len(word_list)

113783

In [17]:
def reverse_word(word):
    return ''.join(reversed(word))

In [18]:
def too_slow():
    count = 0
    for word in word_list:
        if reverse_word(word) in word_list:
            count += 1
    return count

In [19]:
len(word_list) ** 2

12946571089

In [20]:
word_dict = {}
for word in word_list:
    word_dict[word] = 1

In [21]:
def much_faster():
    count = 0
    for word in word_dict:
        if reverse_word(word) in word_dict:
            count += 1
    return count

## 10.4. A collection of counters

In [22]:
counter = {}

In [23]:
counter['a'] = 1

In [24]:
counter['a'] += 1

In [25]:
counter

{'a': 2}

In [26]:
def value_counts(string):
    counter = {}
    for letter in string:
        if letter not in counter:
            counter[letter] = 1
        else:
            counter[letter] += 1
    return counter

In [27]:
counter = value_counts('brontosaurus')
counter

{'b': 1, 'r': 2, 'o': 2, 'n': 1, 't': 1, 's': 2, 'a': 1, 'u': 2}

## 10.5. Looping and dictionaries

In [28]:
counter = value_counts('banana')
counter

{'b': 1, 'a': 3, 'n': 2}

In [29]:
for key in counter:
    print(key)

b
a
n


In [30]:
for value in counter.values():
    print(value)

1
3
2


In [31]:
for key in counter:
    value = counter[key]
    print(key, value)

b 1
a 3
n 2


## 10.6. Lists and dictionaries

In [32]:
d = {4: ['r', 'o', 'u', 's']}
d

{4: ['r', 'o', 'u', 's']}

In [33]:
letters = list('abcd')
d[letters] = 4

TypeError: unhashable type: 'list'

## 10.7. Accumulating a list

In [34]:
def is_palindrome(word):
    """Check if a word is a palindrome."""
    return reverse_word(word) == word

In [35]:
count = 0

for word in word_dict:
    if is_palindrome(word):
        count += 1

count

91

In [36]:
palindromes = []

for word in word_dict:
    if is_palindrome(word):
        palindromes.append(word)

palindromes[:10]

['aa', 'aba', 'aga', 'aha', 'ala', 'alula', 'ama', 'ana', 'anna', 'ava']

In [37]:
long_palindromes = []

for word in palindromes:
    if len(word) >= 7:
        long_palindromes.append(word)

long_palindromes

['deified', 'halalah', 'reifier', 'repaper', 'reviver', 'rotator', 'sememes']

## 10.8. Memos

In [38]:
def fibonacci(n):
    if n == 0:
        return 0
    
    if n == 1:
        return 1
    
    return fibonacci(n - 1) + fibonacci(n - 2)

In [39]:
known = {0:0, 1:1}

def fibonacci_memo(n):
    if n in known:
        return known[n]
    
    res = fibonacci_memo(n - 1) + fibonacci_memo(n - 2)
    known[n] = res
    return res

In [40]:
fibonacci(40)

102334155

In [41]:
fibonacci_memo(40)

102334155

## 10.9. Debugging

- 크기가 큰 dataset에 대한 debugging
    1. 입력 크기 감소
        - 처음엔 작은 크기의 입력으로 시작하고, 점차 늘려가면서 확인
    2. 요약 및 타입 확인
        - 모든 경우를 출력하여 확인하지 말고 요약해서 확인
        - 런타임 오류 방지를 위해 타입을 확인
    3. 자체 검사 작성
        - 정상 검사(sanity check): 나올 수 있는 값인지 정상 여부 검사
        - 일관성 검사(consistency check): 서로 다른 방식으로 계산한 결과를 비교하여 일관성 확인
    4. 출력 형식 지정
        - `pprint` 등을 활용하여 사람이 읽기 쉬운 형식으로 표시

## 10.10. Glossary

- dictionary
- item
- key
- value
- mapping
- hash table
- hashable
- hash function
- accumulator
- filtering
- call graph
- memo

## 10.11. Exercises

### 10.11.1. Ask an assistant

- 왜 파이썬 딕셔너리의 키는 hashable해야 하지?
    > 좋은 질문이에요! 파이썬 딕셔너리에서 **키(key)가 hashable해야 하는 이유**는 딕셔너리의 **구현 방식**과 관련이 있습니다. 간단히 말하면, 파이썬 딕셔너리는 내부적으로 **해시 테이블(Hash Table)** 구조를 사용하기 때문입니다.
    > 
    > ### 🔍 해시 테이블이란?
    > 
    > 해시 테이블은 다음과 같은 방식으로 데이터를 저장하는 자료구조입니다:
    > 
    > 1. **키(key)**에 대해 `hash()` 함수를 적용해 **해시값(hash value)**을 구함.
    > 2. 이 해시값을 기반으로 **어디에 저장할지(인덱스)**를 계산함.
    > 3. 그 위치에 **값(value)**를 저장함.
    > 
    > 이렇게 하면 검색(lookup) 속도가 매우 빠릅니다 — 평균 시간복잡도는 O(1)입니다.
    > 
    > ### ✅ 키가 hashable해야 하는 이유
    > 
    > 딕셔너리 키는 다음 두 가지 조건을 만족해야 합니다:
    > 
    > 1. **해시 가능해야 함 (`__hash__()` 메서드를 가지고 있어야 함)**
    >    그래야 딕셔너리가 내부에서 키의 해시값을 계산해서 어디에 저장할지 결정할 수 있어요.
    > 2. **불변(immutable)해야 함 (동등 비교 시 일관성 유지)**
    >    키가 변할 수 있다면, 이미 저장된 위치에서 검색이 불가능해질 수 있어요.
    >    예: 리스트는 내용을 바꿀 수 있기 때문에 해시값이 바뀔 수도 있고, 이는 딕셔너리 입장에서 큰 문제입니다.
    > 
    > ### 📌 예시
    > 
    > ```python
    > my_dict = {}
    > my_dict[[1, 2, 3]] = "hello"
    > ```
    > 
    > 이 코드는 실행 시 다음과 같은 에러를 냅니다:
    > 
    > ```
    > TypeError: unhashable type: 'list'
    > ```
    > 
    > 왜냐하면 리스트는 mutable하고, 해시 불가능하기 때문입니다.
    > 
    > 반면에 튜플은 immutable이고 hashable이면 키로 쓸 수 있어요:
    > 
    > ```python
    > my_dict = {}
    > my_dict[(1, 2, 3)] = "hello"  # OK
    > ```
    > 
    > ### 🤔 어떤 객체가 hashable한가?
    > 
    > 파이썬에서 `hashable`하려면 다음 조건을 만족해야 합니다:
    > 
    > * `__hash__()` 메서드가 정의되어 있어야 함.
    > * `__eq__()`와 함께 일관되게 작동해야 함.
    > * 객체가 immutable해야 함 (보통은).
    > 
    > ### 🧠 요약
    > 
    > | 조건              | 이유                   |
    > | --------------- | -------------------- |
    > | `__hash__()` 구현 | 딕셔너리가 키의 위치를 계산하기 위해 |
    > | `__eq__()` 구현   | 키가 같다는 걸 판단하기 위해     |
    > | 불변성 (immutable) | 해시값이 변하지 않도록 하기 위해   |

- 파이썬에서 문자열 리스트로 set을 만들고 문자열이 set의 원소인지 어떻게 확인해?
    > 파이썬에서 **문자열 리스트로 `set`을 만들고**, 특정 문자열이 **그 `set`의 원소인지 확인하는 방법**은 아주 간단합니다. 아래에 예제와 함께 설명드릴게요.
    > 
    > ### ✅ 1. 문자열 리스트로 `set` 만들기
    > 
    > ```python
    > words = ["apple", "banana", "cherry"]
    > word_set = set(words)
    > ```
    > 
    > 이렇게 하면 `word_set`은 중복 없는 문자열들의 집합(set)이 됩니다:
    > 
    > ```python
    > {'apple', 'banana', 'cherry'}
    > ```
    > 
    > ### ✅ 2. 문자열이 set에 있는지 확인하기
    > 
    > ```python
    > "banana" in word_set   # True
    > "orange" in word_set   # False
    > ```
    > 
    > `in` 연산자는 집합에 **해당 값이 존재하는지 여부**를 Boolean 값으로 반환합니다.
    > 
    > ### 🔍 전체 예제
    > 
    > ```python
    > words = ["apple", "banana", "cherry"]
    > word_set = set(words)
    > 
    > # 문자열 확인
    > print("banana" in word_set)  # 출력: True
    > print("orange" in word_set)  # 출력: False
    > ```
    > 
    > ### ⏱️ 성능 팁
    > 
    > `set`은 평균적으로 검색 속도가 **O(1)**이기 때문에, 리스트보다 **훨씬 빠르게** 원소 존재 여부를 확인할 수 있습니다.
    > 
    > 예:
    > ```python
    > "banana" in words      # 리스트 검색 → O(n)
    > "banana" in word_set   # 셋 검색 → O(1)
    > ```
    > 
    > 필요하면 리스트에서 바로 확인하는 것도 가능하지만, 많은 검색을 해야 한다면 `set`을 사용하는 게 훨씬 효율적이에요.

### 10.11.2. Exercise

In [42]:
counter = value_counts('brontosaurus')

In [43]:
counter.get('b', 0)

1

In [44]:
counter.get('c', 0)

0

In [45]:
def value_counts(string):
    counter = {}
    for letter in string:
        counter[letter] = counter.get(letter, 0) + 1
    return counter

In [46]:
counter = value_counts('brontosaurus')
counter

{'b': 1, 'r': 2, 'o': 2, 'n': 1, 't': 1, 's': 2, 'a': 1, 'u': 2}

### 10.11.3. Exercise

In [47]:
def has_duplicates(seq):
    counter = {}
    for s in seq:
        if s in counter:
            return True
        else:
            counter[s] = True
    return False

In [48]:
no_repeats = []

for word in word_dict:
    if len(word) > 12 and not has_duplicates(word):
        no_repeats.append(word)

no_repeats

['ambidextrously',
 'lycanthropies',
 'metalworkings',
 'multibranched',
 'unpredictably']

### 10.11.4. Exercise

In [49]:
def find_repeats(counter):
    """Makes a list of keys with values greater than 1.
    
    counter: dictionary that maps from keys to counts
    
    returns: list of keys
    """
    repeats = []
    for key in counter:
        if counter[key] > 1:
            repeats.append(key)
    return repeats

In [50]:
counter1 = value_counts('banana')
counter1

{'b': 1, 'a': 3, 'n': 2}

In [51]:
repeats = find_repeats(counter1)
repeats

['a', 'n']

In [52]:
counter1 = value_counts([1, 2, 3, 2, 1])
repeats = find_repeats(counter1)
repeats

[1, 2]

### 10.11.5. Exercise

In [53]:
counter1 = value_counts('brontosaurus')
counter2 = value_counts('apatosaurus')

In [54]:
def add_counters(counter1, counter2):
    rslt = dict(counter1)
    for key in counter2:
        if key in rslt:
            rslt[key] += counter2[key]
        else:
            rslt[key] = counter2[key]
    return rslt

In [55]:
add_counters(counter1, counter2)

{'b': 1, 'r': 3, 'o': 3, 'n': 1, 't': 2, 's': 4, 'a': 4, 'u': 4, 'p': 1}

### 10.11.6. Exercise

In [56]:
word = 'schooled'
first = word[0:None:2]
first

'shoe'

In [57]:
second = word[1::2]
second

'cold'

In [58]:
def is_interlocking(word):
    first = word[::2]
    second = word[1::2]
    return first in word_dict and second in word_dict

In [59]:
for word in word_list:
    if len(word) >= 8 and is_interlocking(word):
        first = word[0::2]
        second = word[1::2]
        print(word, first, second)

adroitly aril doty
agrarians arras gain
alienees aine lees
arrestee arse rete
arrestees arses rete
ballooned blond aloe
barmaids brad amis
baudrons burn ados
beakless bals ekes
beamless bals emes
bloodred bode lord
blueness buns lees
booklets bolt okes
burseeds bred uses
calliope clip aloe
calliopes clips aloe
cellules clue ells
cheerier cere heir
colludes clue olds
cookless cols okes
coolness cons oles
countess cuts ones
couplets cult opes
dainties dite anis
doorless dols ores
dourness duns ores
fairness fins ares
fleetest fets leet
fleetness fetes lens
foulness funs oles
freeness fens rees
friended fine redd
furrings frig urns
goalless gals oles
greeniest genet reis
greyness gens ryes
grounded gone rudd
hooklets holt okes
ignitron into girn
isleless ills sees
mailless mils ales
moonless mols ones
moonlets molt ones
moonsets most ones
neutrals nurl etas
oghamist ohms gait
parietes pree aits
peakless pals ekes
plainness panes lins
playless pals lyes
pleonasm pens loam
poorness pons ore