dict, set : 중복을 허용하지 않는다. <br>


In [4]:
# immutable dict
# 원래 dict는 mutable이다.

from types import MappingProxyType

d = {'key1':'value1'}

# Read-only
d_frozen = MappingProxyType(d) # 그래도 unhashable이다.

print(d, id(d)) 
print(d_frozen, id(d_frozen))



{'key1': 'value1'} 2319825907776
{'key1': 'value1'} 2319812660768


In [6]:
# frozenset : immutable set
# 원래 set은 mutable이다.

s1 = {'Apple', 'Orange', 'Apple', 'Orange', 'Kiwi'}
print(s1)
s2 = set(['Apple', 'Orange', 'Apple', 'Orange', 'Kiwi'])
s3 = {3}
s4 = set() # mutable

s5 = frozenset(s1) # immutable
print(s5, type(s5), s5 is s1)

s1.add('Melon')

{'Apple', 'Kiwi', 'Orange'}
frozenset({'Apple', 'Kiwi', 'Orange'}) <class 'frozenset'> False


In [8]:
# 선언 최적화
# 바이트 코드 -> 파이썬 인터프리터 실행
from dis import dis

print('-------')
print(dis('{10}')) # {} set 선언
print('---------------')

print(dis('set([10])'))
# 더 단계가 많다.

-------
  1           0 LOAD_CONST               0 (10)
              2 BUILD_SET                1
              4 RETURN_VALUE
None
---------------
  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (10)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE
None


In [10]:
# 지능형 집합 Set Comprehension 

from unicodedata import name

print({name(chr(i), '') for i in range(0,256)})

# name(문자:str, default:str) -> str
# 문자를 넣고 유니코드에서 해당하는 이름을 반환한다. 없으면 디폴트

{'', 'LATIN CAPITAL LETTER O WITH ACUTE', 'LATIN CAPITAL LETTER W', 'LATIN SMALL LETTER A WITH TILDE', 'RIGHT-POINTING DOUBLE ANGLE QUOTATION MARK', 'RIGHT PARENTHESIS', 'LATIN SMALL LETTER Q', 'LATIN CAPITAL LETTER O WITH STROKE', 'LEFT CURLY BRACKET', 'LATIN CAPITAL LETTER A WITH CIRCUMFLEX', 'LATIN CAPITAL LETTER A WITH ACUTE', 'LATIN SMALL LETTER S', 'COPYRIGHT SIGN', 'ACUTE ACCENT', 'NOT SIGN', 'LATIN SMALL LETTER E WITH ACUTE', 'LATIN CAPITAL LETTER O', 'LATIN CAPITAL LETTER B', 'INVERTED EXCLAMATION MARK', 'LATIN SMALL LETTER U WITH DIAERESIS', 'LATIN SMALL LETTER Y WITH ACUTE', 'LATIN SMALL LETTER E WITH DIAERESIS', 'NUMBER SIGN', 'DIGIT FIVE', 'DOLLAR SIGN', 'LATIN SMALL LETTER C', 'LATIN CAPITAL LETTER U WITH DIAERESIS', 'LEFT SQUARE BRACKET', 'SOFT HYPHEN', 'LATIN CAPITAL LETTER F', 'SUPERSCRIPT ONE', 'LATIN CAPITAL LETTER G', 'LATIN SMALL LETTER I', 'LATIN CAPITAL LETTER M', 'LATIN CAPITAL LETTER U WITH CIRCUMFLEX', 'LATIN SMALL LETTER A WITH ACUTE', 'LATIN CAPITAL LETTER H

In [12]:
# list comprehension
# 조건 제시법, 리스트 반환

ex1 = [x for x in range(0,256) if x %2==0]
# 0 이상 256 미만의 수 중에서 짝수인 x를 리스트에 모은다.

# tuple comprehension

ex2 = (x for x in range(0,256) if x %2==0)
# generator를 만든다. 반복문에 넣으면 결국 ex1과 같아지지만 최적화 이슈가 있어서 선호할 수 있다. 
# 미리 값을 만들어둔 것이 아니고 그때그때의 것만 만들고 알고 있다.

# dict comprehension

source = (('k1', 'val1'),
            ('k1', 'val2'),
            ('k2', 'val3'),
            ('k2', 'val4'),
            ('k2', 'val5'))
ex3 = {k: v for k, v in source}
# 똑같이 반복을 수행하면서 ex3[k] = v를 수행하면서 딕셔너리를 확장한다.
#  key : value 형태이다. ,를 쓰지 않는다.

# set comprehension

ex4 = {k for k, _ in source}
# dict comprehension처럼 짝을 짓지 않으면 된다.

print(type(ex1), type(ex2), type(ex3), type(ex4))
print(ex1, ex2, ex3, ex4)

<class 'list'> <class 'generator'> <class 'dict'> <class 'set'>
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254] <generator object <genexpr> at 0x0000021C2064DC80> {'k1': 'val2', 'k2': 'val5'} {'k2', 'k1'}
