3. collections 모듈

4) defaultdict 모듈
    - defaultdict 모듈은 딕셔너리의 요소를 생성할 때 키에 기본 값을
      저장하는 방법이다. 새로운 키를 생성할 때 별다른 조치 없이
      신규 값을 생성할 수 있다. 실제 딕셔너리에서는 키를 생성하지 않고
      해당 키의 값을 호출하려고 할때, 오류가 발생한다.
      즉, 코드에서 first의 키 값을 별도로 생성하지 않은 채 바로
      호출하여 오류가 발생하였다.

In [1]:
d = dict()
print(d["first"])

KeyError: 'first'

4) defaultdict 모듈
    - 그렇다면 defaultdict는 어떻게 작동할까? 

In [3]:
from collections import defaultdict
d = defaultdict(lambda : 0)
print(d["first"])

0


4) defaultdict 모듈
    - 앞서 람다함수를 배운 적을 기억하는가? (lambda 인자 : 표현식)
      으로 문법으로 되어 함수 호출을 간단히 해주는 방법이 있다.
      위의 코드에서 lambda : 0은 defaultdict의 키에 해당하는
      값을 기본적으로 0으로 설정하겠다라는 것이다.
      아울러, 어떤 키가 들어오더라도 처음 값은 전부 0으로 설정한다는
      뜻이다.

4) defalutdict 모듈
    - 또 다른 것으로 defaultdict를 활용해 다음과 같이
      기본 값이 int로 선언해주고, 기존에 없던 key를 호출하면
      다음과 같이 해당키가 0으로 자동 초기화 되는 것을 볼 수 있다.

In [4]:
from collections import defaultdict
d_dict = defaultdict(int)
print(d_dict["a"])
print(d_dict)

0
defaultdict(<class 'int'>, {'a': 0})


4) defalutdict 모듈
    - 또한 심지어 미리 선언하지 않은 key에 해당하는 값에다가 
      값을 더해주는것도 가능하다.

In [8]:
from collections import defaultdict
d_dict = defaultdict(int)
d_dict["a"] += 10
print(d_dict)

defaultdict(<class 'int'>, {'a': 10})


4) defalutdict 모듈
    - 또 다른 예제로 함수를 이용하여 딕셔너리를 초기화하는 코드를 보자

In [10]:
def countLetter(word):
    counter={}
    for letter in word:
        if letter not in counter:
            counter[letter] = 0
        counter[letter] += 1
    return counter # 결과는 전부 1로 초기화가 이루어진다.

4) defalutdict 모듈
    - for 루프 안에 if 조건절을 통해서 counter 딕셔너리에 어떤
      글자가 키(key)로 존재하지 않는 경우, 해당 키에 대한 
      기본값을 0으로 세팅해주고 있다. 이러한 코딩 패턴은 파이썬에서
      딕셔너리를 사용할 때 상당히 자주 접할 수 있는데,
      코드 가독성 측면에서는 이렇게 사소한 처리가 주요 흐름을
      파악하는데 방해가 되기도 합니다.
      
    - 하여 좀 더 좋은 방법은 딕셔너리의 dict.setdefault()함수를 
      사용하는 방법이 있지만, 이역시도 루프를 돌 때마다 setedfault()
      함수가 호출되므로 좀 비효율적이다.
      하여 defaultdict()를 이용하면 이런 루프로 부터 딕셔너러리의
      기본값 처리 코드를 좀 더 효율적으로 기본값으로
      초기화 할 수가 있다.

In [11]:
from collections import defaultdict
def countLetter(word):
    counter = defaultdict(int)
    for letter in word:
        counter[letter] += 1
    return counter

4) defaultdict 모듈
    - 이번 예제는 함수를 이용하여 각 알파벳의 글자의 수를 세어서
      저장을 하고 딕셔너리를 리턴하는 코드

In [13]:
from collections import defaultdict
def groupWords(words):
    grouper = defaultdict(list)
    for word in words:
        length = len(word)
        grouper[length].append(word)
    return grouper
li1 = ["감자","귤","사과","배","오징어","꼼장어"]
dic2 = groupWords(li1)
print(dic2)

defaultdict(<class 'list'>, {2: ['감자', '사과'], 1: ['귤', '배'], 3: ['오징어', '꼼장어']})


4) defaultdict 모듈
    - 위의 내용을 set을 이용하여 만들면 아래 코드와 같다

In [15]:
from collections import defaultdict
def groupWords(words):
    grouper = defaultdict(set)
    for word in words:
        length = len(word)
        grouper[length].add(word)
    return grouper
set1 = set()
set1.add("한국")
set1.add("중국")
set1.add("브라질")
set2 = groupWords(set1)
print(set2)

defaultdict(<class 'set'>, {2: {'한국', '중국'}, 3: {'브라질'}})


4) defaultdict 모듈
    - 이외에도 defaultdict의 초깃값은 아래 코드처럼 리스트 형태로도
      설정할 수 있다.

In [16]:
from collections import defaultdict

s = [('Cyellow',1),('blue',2),("yellow",3),("blue",4),("red",1)]
d = defaultdict(list)
for k,v in s:
    d[k].append(v)
print(d.items())

dict_items([('Cyellow', [1]), ('blue', [2, 4]), ('yellow', [3]), ('red', [1])])


4) defaultdict 모듈
    - 변수에 튜플 데이터들을 이차원 리스트 형태로 저장하였다.
      d = defaultdict(list)로 초깃값을 리스트 형태로 선언한다.
      그 다음 모든 값이 리스트에 들어가 for문을 사용하여 새로운 값을
      추가할 수 있다. 이렇게 하면 위의 s 변수처럼 같은 이름을
      가진 여러개의 키key가 생긴다. defaultdict 모듈은 이런 키의 
      값들을 하나로 만들 때 사용할 수 있는 방법 중 하나다.