# 컬렉션 자료구조
- 시퀸스 자료구조 : 데이터들이 연결 되어 사용하는 자료구조
- 컬렉션 자료구조 : 한곳에 모아서 사용하는 자료구조

> 컬렉션 자료구조의 종류
    - Set
    - Dictionary
    - Collections

> 속성
    - in : 멤버십 연산
    - len : 크기(길이)
    - iter : 반복자

In [3]:
# Set
# 반복적이고 중복요소가 없고 정렬이 되지 않는 컬렉션입니다.
# 중요한 사실!
# 1) 인덱스 연산을 할 수 없다.
# 2) 집합의 종류에 따라서 시간복잡도가 달라집니다.
# 예 ) 삽입 : O(n), 합집합 : O(m + n), 교집합 : O(n)
# C언어 -> Set, MultiSet 
# python -> Set, FrozenSet
# Set : 가변 객체
# FrozenSet : 불변객체 -> 셋의 요소를 변경하는 메서드를 사용할 수 없습니다.
dir(set)

['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

In [5]:
# add(x) : set에 x가 없을 경우 추가합니다.
drinks = {"커피", "요거트스무디"}
print(drinks)
drinks.add("레몬에이드")
print(drinks)

{'요거트스무디', '커피'}
{'레몬에이드', '요거트스무디', '커피'}


In [8]:
# update(B) : 여러 데이터를 한꺼번에 추가할때 사용합니다.
# 기호 : A |= B
drinks |= {"카페라떼", "쉐이크"}
print(drinks)
drinks.update({"딸기라떼", "초코라떼"})
print(drinks)

{'카페라떼', '레몬에이드', '요거트스무디', '쉐이크', '커피'}
{'카페라떼', '레몬에이드', '딸기라떼', '요거트스무디', '쉐이크', '초코라떼', '커피'}


In [20]:
# union(B) : 합집합의 결과와 같은 효과를 냅니다.
# 기호 : A | B
games = {"LOL", "배그", "하스스톤"}
# games = games.union({"메이플", "바람의나라"})
games = games | {"메이플", "바람의나라"}
print(games)

{'하스스톤', 'LOL', '배그', '바람의나라', '메이플'}


In [23]:
# intersection(B) : 교집합
# 기호 : A & B
newgames = {"메이플", "피파", "심즈4"}
print(games.intersection(newgames))
print(games & newgames)

{'메이플'}
{'메이플'}


In [25]:
# difference(B) : 차집합
# 기호 : A - B
print(games.difference(newgames))
print(games - newgames)

{'바람의나라', '하스스톤', 'LOL', '배그'}
{'바람의나라', '하스스톤', 'LOL', '배그'}


In [27]:
# clear() : Set의 모든 요소를 삭제
newgames.clear()
newgames

set()

In [30]:
# 삭제메서드
# discard(x) : set 내부에 있는 x를 삭제하고 반환값이 없습니다.
# remove(x) : 항목에 x가 없을 경우 KeyError를 반환
# pop : 한 항목을 무작위로 제거하고 그 항목을 반환합니다.
drinks.discard("레몬에이드")
print(drinks)

{'카페라떼', '딸기라떼', '요거트스무디', '쉐이크', '초코라떼', '커피'}


In [32]:
drinks.remove("요거트스무디")

In [33]:
drinks.pop()

'카페라떼'

In [13]:
# list를 set으로 형변환 한 뒤
# 1) 중복된 값을 제거한 뒤 반환하는 함수
#  인자수 1개 l1
# 2) 교집합의 결과를 반환하는 함수
 # 인자수 2개 l1, l2
# 3) 합집합의 결과를 반환하는 함수
# 인자수 2개 l1, l2

# 결과값은 main 함수에서 확인합니다.
# assert()를 사용합니다.

def remove(l1):
    return list(set(l1))

def intersection(l1, l2):
    return list(set(l1) & set(l2))

def union(l1, l2):
    return list(set(l1) | set(l2))


def main():
    l1 = [1,2,3,4,5,5,8,8,9,10,11,12,12,13,14]
    l2 = [4,5,6,7,8,9,10]
    l3 = []
    
    assert(remove(l1) == [1,2,3,4,5,8,9,10,11,12,13,14])
    assert(intersection(l1,l2) == [4,5,8,9,10])
    assert(union(l2,l3) == sorted(l2))
    print("성공!")
if __name__ == "__main__":
    main()

#assert를 통과한다면 성공! 이라는 멘트를 출력

성공!


In [14]:
# dictionary
# 해쉬테이블 : 특정 객체에 해당하는 임의의 정수 값을 상수 시간내에 계산
# 정수, 연관 배열의 인덱스를 사용합니다.
# 키와 값이 연관이 되어져 있기 때문에
# 컬렉션 매핑 타입이라고 합니다.
# 반복, in, len
# 매핑 ? 키 - 값 항목의 컬렉션입니다.
# 정렬되지 않은 매핑 타입은 임의적인 순서대로 항목을 순회
# 시간복잡도 : O(1) -> 항목의 추가 제거가 자유롭다.
# 슬라이싱 기능을 사용할 수 없다.

In [19]:
# setdefault(key, value) : 딕셔너리의 키의 존재여부를 모른채 접근하는 경우 사용
# 주의 : 딕셔너리에 포함되어 있지 않는 키를 접근할 경우 예외처리가 된다.
# key가 존재하지 않는다면 새 키와 기본값 default가 딕셔너리에 저장을 하게 됩니다.
def usual_dict(dict_data):
    # 공란의 딕셔너리를 만든다.
    new_data = {}
    for k, v in dict_data:
        # 데이터 안에 키값이 있다면
        if k in new_data:
            # 그 키값에 밸류값을 연결합니다.
            new_data[k].append(v)
        # 데이터 안에 키값이 없다면
        else :
            new_data[k] = [v]
    return new_data

def setdefault_dict(dict_data):
    new_data = {}
    for k,v in dict_data:
        new_data.setdefault(k, []).append(v)
    return new_data

def main():
    dict_data = (("key1", "value1"),
                ("key1", "value2"),
                ("key2", "value1"),
                ("key2", "value2"),
                ("key2", "value3"),)
    
    print(usual_dict(dict_data))
    print(setdefault_dict(dict_data))
    
if __name__ == "__main__":
    main()

{'key1': ['value1', 'value2'], 'key2': ['value1', 'value3'], 'key2,': ['value2']}
{'key1': ['value1', 'value2'], 'key2': ['value1', 'value3'], 'key2,': ['value2']}


In [24]:
#update(B) : 딕셔너리 A에 B키가 존재한다면
# A(키, 값) B(키, 값) 으로 갱신합니다.
# B의 키가 A에 존재하지 않는다면 B의 (키, 값) A에 추가합니다.
temp = {"A" : 1, "B" : 5}
temp.update({"C" : 100})
print(temp)
temp["C"] = [100, 20, 30]
print(temp)
# 딕셔너리의 키값을 수정하지 못한다.
# 대신 수정을 하고 싶다면 삭제 뒤 새로 추가한다.

{'A': 1, 'B': 5, 'C': 100}
{'A': 1, 'B': 5, 'C': [100, 20, 30]}


In [31]:
# get(key) : 키값을 반환한다. 키값이 없다면 키값을 반환하지 않는다.
jin = dict(name="진혁", age=1000, hobby="운전")
print(jin.get("name"))
print(jin.get("language"))

진혁
None


In [34]:
# 읽기 전용 반복 객체 메서드
# items() : 키, 밸류
print(jin.items())
# keys() : 키값들
print(jin.keys())
# values() : 밸류값들
print(jin.values())

dict_items([('name', '진혁'), ('age', 1000), ('hobby', '운전')])
dict_keys(['name', 'age', 'hobby'])
dict_values(['진혁', 1000, '운전'])


In [35]:
# pop(key) : 원하는 키를 찾아서 삭제후 반환
jin.pop("hobby")

'운전'

In [36]:
# popitem() : 가장 뒤에 있는 키와 밸류값을 삭제후 반환
jin.popitem()

('age', 1000)

In [37]:
jin

{'name': '진혁'}

In [38]:
# clear() 모든 딕셔너리의 항목 삭제

In [39]:
jin.clear()

In [40]:
jin

{}

In [1]:
# 딕셔너리 성능 측정
import timeit
import random
for i in range(1000, 100001, 200):
    t = timeit.Timer("random.randrange(%d) in x" % i, "from __main__ import random, x")
    x = list(range(i)) # 리스트
    lst_time = t.timeit(number = 1000)
    x = {j : None for j in range(i)}
    d_time = t.timeit(number=1000)
    print('%d, %10.3f, %10.3f' % (i, lst_time, d_time))

1000,      0.005,      0.001
1200,      0.005,      0.001
1400,      0.006,      0.001
1600,      0.007,      0.001
1800,      0.008,      0.001
2000,      0.009,      0.001
2200,      0.009,      0.001
2400,      0.010,      0.001
2600,      0.011,      0.001
2800,      0.012,      0.001
3000,      0.013,      0.001
3200,      0.013,      0.001
3400,      0.014,      0.001
3600,      0.015,      0.001
3800,      0.015,      0.001
4000,      0.017,      0.001
4200,      0.017,      0.001
4400,      0.019,      0.001
4600,      0.019,      0.001
4800,      0.019,      0.001
5000,      0.021,      0.001
5200,      0.021,      0.001
5400,      0.022,      0.001
5600,      0.022,      0.001
5800,      0.023,      0.001
6000,      0.024,      0.001
6200,      0.024,      0.001
6400,      0.026,      0.001
6600,      0.027,      0.001
6800,      0.027,      0.001
7000,      0.028,      0.001
7200,      0.029,      0.001
7400,      0.030,      0.001
7600,      0.030,      0.001
7800,      0.0

56000,      0.220,      0.001
56200,      0.213,      0.001
56400,      0.219,      0.001
56600,      0.218,      0.001
56800,      0.226,      0.001
57000,      0.226,      0.001
57200,      0.225,      0.001
57400,      0.229,      0.001
57600,      0.221,      0.001
57800,      0.221,      0.001
58000,      0.224,      0.001
58200,      0.237,      0.001
58400,      0.226,      0.001
58600,      0.229,      0.001
58800,      0.231,      0.001
59000,      0.231,      0.001
59200,      0.235,      0.001
59400,      0.224,      0.001
59600,      0.229,      0.001
59800,      0.227,      0.001
60000,      0.240,      0.001
60200,      0.239,      0.001
60400,      0.238,      0.001
60600,      0.241,      0.001
60800,      0.234,      0.001
61000,      0.248,      0.001
61200,      0.255,      0.001
61400,      0.241,      0.001
61600,      0.247,      0.001
61800,      0.258,      0.001
62000,      0.249,      0.001
62200,      0.239,      0.001
62400,      0.244,      0.001
62600,    

In [69]:
# 딕셔너리 순회법
# a : hello
# b : world
# c : !
# c,b,a 순서

# a Hello
# b world
# c !
my_dict = {'a' : 'hello', 'b' : 'world', 'c' : '!'}
def convert_dic(x):
    y = []
    for i in x.values():
        y.append(i)
    return ' '.join(y)

data = dict(c='!', b='world', a='hello')
for k in sorted(data.keys()):
    print(k, data[k])

a hello
b world
c !


In [50]:
convert_dic(my_dict)

'hello world !'

In [75]:
# 딕셔너리 분기
# if문을 사용해서 분기문 작성
ac = 'w'
# if ac == 'h':
#     print('hello')
# elif ac == 'w':
#     print('world')
    
    

def hello():
    print('hello')

def world():
    print('world')
    
funcs = dict(h=hello, w=world)
funcs[ac]()

world


In [37]:
# 컬렉션 타입
# 내장되어 있는 기본 기능보다 훨씬 성능이 좋습니다.
from collections import defaultdict
# collections.defaultdict : 기본적인 딕셔너리의 기능이 다 사용 가능
# 누락된 기능까지 사용이 가능합니다.
# 일반적인 딕셔너리
def example():
    data1 = {('LOL', 'AOS'), ('BAG','FPS'),('GTA','AAA')}
    d1 = {}
    for k,v in data1:
        if k not in d1:
            d1[k] = []
        d1[k].append(v)
    print(d1)
    
    #default
    d2 = defaultdict(list)
    for k,v in data1:
        d2[k].append(v)
    print(d2)

In [38]:
example()

{'BAG': ['FPS'], 'LOL': ['AOS'], 'GTA': ['AAA']}
defaultdict(<class 'list'>, {'BAG': ['FPS'], 'LOL': ['AOS'], 'GTA': ['AAA']})


In [44]:
# 정렬된 딕셔너리
# 일반 딕셔너리의 기능을 모두 가지고 있는데
# 추가한 삽입 순서대로 항목을 저장합니다.
from collections import OrderedDict
todo = OrderedDict()
todo[1] = '양치하기'
todo[3] = '아침먹기'
todo[5] = '출근하기'
print(todo)

OrderedDict([(1, '양치하기'), (3, '아침먹기'), (5, '출근하기')])


In [72]:
data1 = dict(a='nice', b='to', c ='meet', d='you')
for i in data1.keys():
    print(i, data1[i])

a nice
b to
c meet
d you


In [74]:
from collections import OrderedDict
data2 = OrderedDict()
data2[0] = 'nice'
data2[1] = 'to'
data2[2] = 'meet'
data2[3] = 'you'
print(data2)
for i in data2.keys():
    print(i, data2[i])

OrderedDict([(0, 'nice'), (1, 'to'), (2, 'meet'), (3, 'you')])
0 nice
1 to
2 meet
3 you


In [79]:
def example2():
    list1 = [("c","!"), ("b","world"),("a","hello")]
    d1= {}
    for key, val in list1:
        if key not in d1:
            d1[key] = []
        d1[key].append(val)
    for key in d1:
        print(key, d1[key])
        
    # 정렬 딕셔너리
    d2 = OrderedDict(list1)
    for key in d2:
        print(key, d2[key])

In [80]:
example2()

c ['!']
b ['world']
a ['hello']
c !
b world
a hello


In [None]:
# 숙제 example2() 주석 처리