# Python intermediate Stduy group

## Reference : https://github.com/KaggleBreak/interpy-kr

- 위 내용을 참고하여 재학습하였습니다.

# Collection 구성

## collections 제공 요소
: tuple, dict 에 대한 확장 데이터 구조를 제공

|  <center>주요 요소</center> |  <center>설명</center> |  <center>추가된 버전</center> |
|:--------|:--------|--------:|
| <center>namedtuple()</center>  | Tuple 타입의 subclass를 만들어 주는 function | *New in version 2.6* |
| <center>OrderedDict</center>  | dict subclass that remembers the order entries were added |*New in version 2.7* |
| <center>Counter</center>  | dict subclass for counting hashable objects |*New in version 2.7* |
| <center>defaultdict</center>  | dict subclass that calls a factory function to supply missing values |*New in version 2.7* |
| <center>deque</center>  | list-like container with fast appends and pops on either end |*New in version 2.4* |

## 1. tuple

- tuple 타입은 immutable 타입으로 내부 원소에 대해 갱신이 불가능하여 리스트처리보다 제한적이다.
- slicing은 string 처럼 처리 가능

In [2]:
tuple_practice = (1, )

In [3]:
print(tuple_practice)

(1,)


In [5]:
# concat tuple structure

(1, 2, 3) + (4, 5, 6)

(1, 2, 3, 4, 5, 6)

In [8]:
('Hi!',) * 4

('Hi!', 'Hi!', 'Hi!', 'Hi!')

In [9]:
('Hi!') * 4

'Hi!Hi!Hi!Hi!'

In [10]:
3 in (1, 2, 3)

True

In [11]:
for x in (1, 2, 4):
    print(x)

1
2
4


In [12]:
t = (1, 2, 3, 4, 5)

t.count(3)

1

In [14]:
t.index(0)

ValueError: tuple.index(x): x not in tuple

In [17]:
# 튜플 내의 원소의 위치를 보여준다. 1은 0 위치에 있다. 이렇게 이해하면 됨

print(t.index(1), t.index(2), t.index(3), t.index(4), t.index(5))

0 1 2 3 4


-----------------------------

### 2. namedtuple
- Tuple을 보다 명시적으로 사용하기 위해 index보다 name을 키로 이용하여 접근하기 위해 만든 별도의 function class
- 여전히 불변
- namedtuple 인스턴스는 인스턴스당 사전들을 가지지 않으므로, 일반 튜플보다 더 가볍고 메모리 사용량 줄일수 있음. dict보다 빠름.

In [18]:
from collections import namedtuple

In [19]:
help(namedtuple)

Help on function namedtuple in module collections:

namedtuple(typename, field_names, *, verbose=False, rename=False, module=None)
    Returns a new subclass of tuple with named fields.
    
    >>> Point = namedtuple('Point', ['x', 'y'])
    >>> Point.__doc__                   # docstring for the new class
    'Point(x, y)'
    >>> p = Point(11, y=22)             # instantiate with positional args or keywords
    >>> p[0] + p[1]                     # indexable like a plain tuple
    33
    >>> x, y = p                        # unpack like a regular tuple
    >>> x, y
    (11, 22)
    >>> p.x + p.y                       # fields also accessible by name
    33
    >>> d = p._asdict()                 # convert to a dictionary
    >>> d['x']
    11
    >>> Point(**d)                      # convert from a dictionary
    Point(x=11, y=22)
    >>> p._replace(x=100)               # _replace() is like str.replace() but targets named fields
    Point(x=100, y=22)



In [20]:
point = namedtuple('point', ['x', 'y'])

In [21]:
print(f'subclass check : {issubclass(point, tuple)}')

subclass check : True


In [22]:
print(point.__doc__)

point(x, y)


In [23]:
p = point(11, y=22)
p[0] + p[1] 

33

In [24]:
p

point(x=11, y=22)

In [26]:
# 필드명을 키워드로 정의시 에러 발생

with_class = namedtuple('Person', 'name class age gender')

ValueError: Type names and field names cannot be a keyword: 'class'

In [28]:
# rename = True로 정의하면 필드명이 중복이거나 명명이 불가한 경우 이름을 바꿈)

with_class = namedtuple('Person', 'name class age gender', rename=True)

In [30]:
print(with_class._fields)

('name', '_1', 'age', 'gender')


In [32]:
a = with_class("dah1", "a", 10, "f")
print(a._1)

a


In [33]:
a = with_class("dah1", "asdfqwerzxcv", 10, "f")
print(a._1)

asdfqwerzxcv


In [35]:
# 중복이 있을 때도 자동으로 명명해준다.

two_ages = namedtuple('Person', 'name age gender age', rename=True)
print(two_ages._fields)

('name', 'age', 'gender', '_3')


#### namedtuple 메소드

In [37]:
person = namedtuple('Person', 'name age gender')
print('Type of person:', type(person))

Type of person: <class 'type'>


In [38]:
bob = person(name='Bob', age=30, gender='male')
print(bob)

Person(name='Bob', age=30, gender='male')


In [39]:
print(bob._fields)

('name', 'age', 'gender')


In [41]:
# orderd dict 타입으로 변환

print(bob._asdict())

OrderedDict([('name', 'Bob'), ('age', 30), ('gender', 'male')])


In [42]:
# 다른 인스턴스를 생성

jane = bob._make(['Jane', 29, 'female'])
print(jane.name)
print(jane)

Jane
Person(name='Jane', age=29, gender='female')


In [44]:
Person = namedtuple('Person', 'name age gender')
print('Type of Person:', type(Person))

bob = Person(name='Bob', age=30, gender='male')
print('\nRepresentation:', bob)

# 변경된 튜플은 새로운 객체로 만듬
bob = bob._replace(age=50)
print(bob)
print(bob.index(50))
print(bob.count(50))

Type of Person: <class 'type'>

Representation: Person(name='Bob', age=30, gender='male')
Person(name='Bob', age=50, gender='male')
1
1


----------------------------

### 3. dict

In [45]:
d = {"k" : 1, "l" : 2}
d_copy = d.copy()
d_copy

{'k': 1, 'l': 2}

In [48]:
# dict 객체의 키를 새로운 dict객체를 생성하는 키로 처리

d_fromkeys = d.fromkeys(d)
d_fromkeys

{'k': None, 'l': None}

In [49]:
# 키를 가지고 dict 의 값을 가져옴

print(d.get('k'))

1


In [50]:
print(d['k'])

1


In [51]:
print(d.get('a'))

None


In [52]:
print(d['a'])

KeyError: 'a'

그러니 우리는 get을 써서 에러를 막아야한다.

In [53]:
print(d.items())

dict_items([('k', 1), ('l', 2)])


In [54]:
d.keys()

dict_keys(['k', 'l'])

In [56]:
list(d.keys())

['k', 'l']

In [57]:
# dict 내의 키와 값을 추가

d.setdefault('s', 3)
print(d)

{'k': 1, 'l': 2, 's': 3}


In [58]:
d['t'] = 5
print(d)

{'k': 1, 'l': 2, 's': 3, 't': 5}


In [59]:
d.update({1: 1})
print(d)

{'k': 1, 'l': 2, 's': 3, 't': 5, 1: 1}


In [60]:
d.values()

dict_values([1, 2, 3, 5, 1])

In [61]:
print(d)

{'k': 1, 'l': 2, 's': 3, 't': 5, 1: 1}


In [62]:
print(d)
print(d.pop('s')) # dict내의 원소를 삭제

{'k': 1, 'l': 2, 's': 3, 't': 5, 1: 1}
3


In [63]:
d

{'k': 1, 'l': 2, 't': 5, 1: 1}

In [64]:
d = {"k":1, "l":2}
d.clear()   # dict 객체 내 요소들 클리어
d

{}

-------------------------------

### 4. OrderedDict

- OrderedDict는 dict의 subclass로써 새로운 인스턴스를 만드는 클래스.  
- 기존 키의 값을 덮어 쓰더라도 해당 키의 위치는 변하지 않음.  
- 항목을 삭제했다가 다시 삽입하면 키가 사전 끝으로 이동.
- collections.OrderedDict는 순서를 유지하기 위해 linked list로 내부에 구성되어 각 순서를 유지함

In [65]:
import collections

In [66]:
help(collections.OrderedDict)

Help on class OrderedDict in module collections:

class OrderedDict(builtins.dict)
 |  Dictionary that remembers insertion order
 |  
 |  Method resolution order:
 |      OrderedDict
 |      builtins.dict
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  __delitem__(self, key, /)
 |      Delete self[key].
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __init__(self, /, *args, **kwargs)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __le__(self, value, /)
 |      Return self<=value.
 |  
 |  __lt__(self, value, /)
 |      Return self<value.
 |  
 |  __ne__(self, value, /)
 |      Return self!=value.
 |  
 |  __new__(*args, **kwargs) from builtins.type
 |      Create and return a new object.  See help(type) for accurate signature.
 |  
 |  __reduc

In [67]:
d = {'banana':3, 'pear':4, 'orange':1, 'apple':2}

# dictionary sorted by key

for key, value in d.items():
    print(key, value)

banana 3
pear 4
orange 1
apple 2


In [68]:
print(sorted(d.items(), key = lambda x : x[0]))

[('apple', 2), ('banana', 3), ('orange', 1), ('pear', 4)]


In [69]:
from collections import OrderedDict

In [70]:
ordered_dict = OrderedDict(sorted(d.items(), key=lambda x : x[0]))
print(ordered_dict)

OrderedDict([('apple', 2), ('banana', 3), ('orange', 1), ('pear', 4)])


### OrderedDict - pop 메소드 

In [71]:
practice_dict = {}

practice_dict['a'] = 1
practice_dict['b'] = 2

print(practice_dict)

{'a': 1, 'b': 2}


In [72]:
ordered_practice_dict = OrderedDict({'b':2, 'a':1})
print(ordered_practice_dict)

OrderedDict([('b', 2), ('a', 1)])


In [73]:
print(ordered_practice_dict.pop('b'))
print(ordered_practice_dict)

2
OrderedDict([('a', 1)])


In [75]:
print(practice_dict.pop('b'))
print(practice_dict)

2
{'a': 1}


### OrderedDict - move_to_end 메소드
- collections.OrderedDict는 순서를 유지하고 있어서 dict타입처럼 처리하기 위해서는 move_to_end 메소드를 이용해서 처리
- OrderedDict.move_to_end() 메소드는 key가 존재할 경우, (key,value)를 맨 오른쪽(뒤) 또는 맨 왼쪽(앞)으로 이동해주는 메소드이다. move_to_end(key, last=True)의 인자인 last=는 True 일 경우 맨 오른쪽(뒤)로 이동하고, False 인 경우 맨 왼쪽(앞)으로 이동한다.

출처: https://excelsior-cjh.tistory.com/98 [EXCELSIOR]

In [79]:
practice_dict.clear()
practice_dict

{}

In [80]:
practice_dict = OrderedDict([('a', '1'), ('b', '2')])
practice_dict.update({'c' : '3'})
print(practice_dict)

OrderedDict([('a', '1'), ('b', '2'), ('c', '3')])


In [81]:
practice_dict.move_to_end('c', last=False)
print(practice_dict)

OrderedDict([('c', '3'), ('a', '1'), ('b', '2')])


In [82]:
practice_dict.move_to_end?

[0;31mDocstring:[0m
Move an existing element to the end (or beginning if last==False).

Raises KeyError if the element does not exist.
When last=True, acts like a fast version of self[key]=self.pop(key).
[0;31mType:[0m      builtin_function_or_method


In [88]:
practice_dict.move_to_end('a', last=False)
print(practice_dict)

OrderedDict([('a', '1'), ('b', '2'), ('c', '3')])


In [89]:
practice_dict.move_to_end('a', last=True)
print(practice_dict)

OrderedDict([('b', '2'), ('c', '3'), ('a', '1')])


- OrderedDict 클래스에서 순서가 다르면 다른것으로 인식함

In [90]:
practice_dict_one = OrderedDict(name = 'name', age = 30)
print(practice_dict_one)
print(practice_dict_one['name'])

OrderedDict([('name', 'name'), ('age', 30)])
name


In [95]:
practice_dict_two = OrderedDict(age = 30, name = 'name')
print(practice_dict_two)
print(practice_dict_two['name'])

OrderedDict([('age', 30), ('name', 'name')])
name


In [96]:
# compare two things.....

print(practice_dict_one == practice_dict_two)

False


In [97]:
print(practice_dict_two.move_to_end('name', last=False))
print(practice_dict_two)

None
OrderedDict([('name', 'name'), ('age', 30)])


In [98]:
# re - compare two things.....

print(practice_dict_one == practice_dict_two)

True


-------------------------

### 5. Counter

- Counter는 dict의 subclass로써 새로운 인스턴스를 만드는 클래스
- 특정 아이템의 개수를 세는 함수

#### COUNTER 생성 예시
- Counter 클래스로 생성하는 이유는 실제 키값들에 연속된 상황 확인이 필요한 경우 사용

In [99]:
from collections import Counter

In [100]:
Counter("attacked")

Counter({'a': 2, 't': 2, 'c': 1, 'k': 1, 'e': 1, 'd': 1})

In [101]:
Counter({1:3, 2:4})

Counter({1: 3, 2: 4})

In [102]:
Counter({1:3, 2:4}.items())

Counter({(1, 3): 1, (2, 4): 1})

In [103]:
Counter([1, 4, 3])

Counter({1: 1, 4: 1, 3: 1})

In [104]:
Counter(['a', 'a', 'b', 'c', 'd', 'd', 'd'])

Counter({'a': 2, 'b': 1, 'c': 1, 'd': 3})

#### Counter 추가 메서드

In [105]:
a1 = Counter([1,2,3,4])
a2 = Counter({1:2, 2:4})
print(a1)
print(a2)

Counter({1: 1, 2: 1, 3: 1, 4: 1})
Counter({2: 4, 1: 2})


In [107]:
# Counter 인스턴스의 요소를 counter 개수만큼 보여줌

print(a1.elements())
print(list(a1.elements()))

<itertools.chain object at 0x1107c90b8>
[1, 2, 3, 4]


In [108]:
# Counter 인스턴스의 값을 튜플로 key/value를 묶어서 리스트로 보여줌

print(list(a2.elements()))
print(a2.most_common())

[1, 1, 2, 2, 2, 2]
[(2, 4), (1, 2)]


In [109]:
sample_Counter = Counter(['a', 'a', 'b', 'c', 'd', 'd', 'd'])

print(sample_Counter.most_common())

[('d', 3), ('a', 2), ('b', 1), ('c', 1)]


In [110]:
# Counter 인스턴스들간에 값을 뺌

a2.subtract(a1)
print(a2)
print(a2+a1)

Counter({2: 3, 1: 1, 3: -1, 4: -1})
Counter({2: 4, 1: 2})


In [111]:
s1 = Counter("abceabde")
s2 = Counter("defabc")
print("s1 : ", s1)
print("s2 : ", s2)

# Counter 더하기
s_add = s1 + s2
print("s1 + s2 : ", s_add)

# Counter 빼기
s_sub = s1 - s2
print("s1 - s2 : ", s_sub)

s_sub2 = s2 - s1
print("s2 - s1 : ", s_sub2)
print('-' * 50)

#교집합
s_intersection = s1 & s2
print("s1 & s2 : ", s_intersection)
# 합집합
s_union = s1 | s2
print("s1 | s2 : ", s_union)

s1 :  Counter({'a': 2, 'b': 2, 'e': 2, 'c': 1, 'd': 1})
s2 :  Counter({'d': 1, 'e': 1, 'f': 1, 'a': 1, 'b': 1, 'c': 1})
s1 + s2 :  Counter({'a': 3, 'b': 3, 'e': 3, 'c': 2, 'd': 2, 'f': 1})
s1 - s2 :  Counter({'a': 1, 'b': 1, 'e': 1})
s2 - s1 :  Counter({'f': 1})
--------------------------------------------------
s1 & s2 :  Counter({'a': 1, 'b': 1, 'c': 1, 'e': 1, 'd': 1})
s1 | s2 :  Counter({'a': 2, 'b': 2, 'e': 2, 'c': 1, 'd': 1, 'f': 1})


#### Counter 인스턴스는 dict 타입처럼 키를 통해 접근 가능

In [112]:
alphabet_string = Counter("abceabde")
print(alphabet_string)
print('-'*50)

Counter({'a': 2, 'b': 2, 'e': 2, 'c': 1, 'd': 1})
--------------------------------------------------


In [113]:
for item in "abcdef":
    print(item, " : ", alphabet_string[item])
    
print("alphabet_string element ", [alphabet for alphabet in alphabet_string.elements()])

a  :  2
b  :  2
c  :  1
d  :  1
e  :  2
f  :  0
alphabet_string element  ['a', 'a', 'b', 'b', 'c', 'e', 'e', 'd']


In [114]:
list(alphabet_string.elements())

['a', 'a', 'b', 'b', 'c', 'e', 'e', 'd']

-------------------------------------------

### 6. defaultdict
- dict의 subclass로써 새로운 인스턴스를 만드는 클래스
- dict와는 달리 key값의 존재 유무를 확인할 필요가 없음

In [115]:
issubclass(collections.defaultdict, dict)

True

In [117]:
from collections import defaultdict

In [122]:
help(defaultdict.default_factory)
a = defaultdict(list)
print(a['key'])
print('-' * 50)
print(a)

Help on member descriptor collections.defaultdict.default_factory:

default_factory
    Factory for default value called by __missing__().

[]
--------------------------------------------------
defaultdict(<class 'list'>, {'key': []})


In [121]:
d = dict()
print(d['key'])

KeyError: 'key'

#### defaultdict : list값 처리
- defaultdict는 값 객체를 list로 처리하여 순차적인 여러 값(key: multi-value 구조)을 처리

In [123]:
from collections import defaultdict

a = defaultdict(list)
print(a)


a['1'].extend([1,2,3])
print(a)

defaultdict(<class 'list'>, {})
defaultdict(<class 'list'>, {'1': [1, 2, 3]})


In [128]:
colours = (
  ('태희', '노랑'),
  ('지훈', '파랑'),
  ('별이', '초록'),
  ('지훈', '검정'),
  ('태희', '빨강'),
  ('샛별', '실버'),
)

favourite_colours = defaultdict(list)

for name, colour in colours:
    favourite_colours[name].append(colour)

print(favourite_colours)

defaultdict(<class 'list'>, {'태희': ['노랑', '빨강'], '지훈': ['파랑', '검정'], '별이': ['초록'], '샛별': ['실버']})


#### defaultdict : set 값 처리
- defaultdict는 값 객체를 list로 처리하여 유일한 원소를 가지는 여러값(key:multi-value 구조)을 처리

In [129]:
a = defaultdict(set)
print(a)

a['s'].update([1,2,3,1])
print(a)

defaultdict(<class 'set'>, {})
defaultdict(<class 'set'>, {'s': {1, 2, 3}})


In [131]:
a.clear()

In [132]:
a = defaultdict()
print(a)

a['s'].update([1,2,3,1])
print(a)

defaultdict(None, {})


KeyError: 's'

In [133]:
from collections import defaultdict

def default_factory():
    return 'default value'

d = defaultdict(default_factory, foo='bar')
print('d : ', d)
print('foo =>', d['foo'])
print('bar =>', d['bar'])

d1 = defaultdict(list, foo=[1,2,3])
print('d1 : ', d1)

d :  defaultdict(<function default_factory at 0x110808d08>, {'foo': 'bar'})
foo => bar
bar => default value
d1 :  defaultdict(<class 'list'>, {'foo': [1, 2, 3]})


In [134]:
# 아래 단락은 키에러 뜸
# some_dict = {}
# some_dict['colours']['favourite'] = "노랑"

# defaultdict로 작업하면 해결가능
tree = lambda: defaultdict(tree)
some_dict = tree()
some_dict['colours']['favourite'] = "노랑"
print(some_dict)
print('-' * 50)

import json
print(json.dumps(some_dict))

defaultdict(<function <lambda> at 0x1108080d0>, {'colours': defaultdict(<function <lambda> at 0x1108080d0>, {'favourite': '노랑'})})
--------------------------------------------------
{"colours": {"favourite": "\ub178\ub791"}}


-----------------------

### 7. deque
- 새로운 인스턴스를 만드는 클래스
- 양방향에서 처리할 수 있는 double ended queue 자료 구조

In [136]:
from collections import deque

In [137]:
# deque의 메서드
for method in dir(deque):
    if method.startswith('__'):
        pass
    else:
        print(method)

append
appendleft
clear
copy
count
extend
extendleft
index
insert
maxlen
pop
popleft
remove
reverse
rotate


In [139]:
# deque 생성
from collections import deque
d = deque([1,2,3], 5) # que의 최대 길이도 설정됨 '5'
print(d)

d.extend([4,5,6]) # 4,5,6이 들어가니까 기존에 있는 1,2,3 중 1이 밀려서 사라짐
print(d)
print('-' * 50)

dd = deque([1,2,3])
print(dd)

dd.extend(dd)
print(dd)

deque([1, 2, 3], maxlen=5)
deque([2, 3, 4, 5, 6], maxlen=5)
--------------------------------------------------
deque([1, 2, 3])
deque([1, 2, 3, 1, 2, 3])


#### deque 메서드

In [142]:
d = deque([1,2,3])
d.append(1)   # 우측에 원소 추가
print(d)

deque([1, 2, 3, 1])


In [143]:
d.appendleft(3)  # 좌측에 원소 추가
print(d)

deque([3, 1, 2, 3, 1])


In [144]:
d.count(3) # 원소의 개수

2

In [145]:
d.extend([2,3,4])  # 리스트 등을 기존 인스턴스에 추가
print(d)

deque([3, 1, 2, 3, 1, 2, 3, 4])


In [146]:
d.extendleft([10, 12])  # 기존 인스턴스 좌측부터 추가
print(d)

deque([12, 10, 3, 1, 2, 3, 1, 2, 3, 4])


In [147]:
d.clear()  # 요소들을 전부 초기화
print(d)
deque([])

deque([])


deque([])

In [148]:
d = deque([3, 10, 12, 4, 3, 2])
print(d.pop())  #우측 요소 삭제
print(d)

2
deque([3, 10, 12, 4, 3])


In [149]:
d = deque([3, 10, 12, 4, 3])
print(d.popleft())  # 좌측 요소 삭제
print(d)

3
deque([10, 12, 4, 3])


In [150]:
d = deque([1, 3, 10, 12, 4, 3, 2])
d.remove(1)  # 값으로 요소 삭제
print(d)

deque([3, 10, 12, 4, 3, 2])


In [151]:
d = deque([1, 3, 10, 1, 12, 4, 3, 2])
d.remove(1)  # 값으로 요소 삭제(좌측부터)
print(d)

deque([3, 10, 1, 12, 4, 3, 2])


In [152]:
d = deque([2, 3, 4, 12, 10, 3, 1])
d.reverse()  # 내부 요소들을 역정렬
print(d)

deque([1, 3, 10, 12, 4, 3, 2])


In [153]:
d = deque([4, 12, 10, 3, 1, 2, 3])
d.rotate(2)  # 요소들을 n값만큼 순회
print(d)

deque([2, 3, 4, 12, 10, 3, 1])


In [155]:
d = deque([4, 12, 10, 3, 1, 2, 3])
d.rotate(5)  # 요소들을 n값만큼 순회(오른쪽에 있는 값이 왼쪽으로)
print(d)

deque([10, 3, 1, 2, 3, 4, 12])


#### deque(양방향 queue) 다루기
: 앞과 뒤로 모든 queue 처리가 가능

In [156]:
d = deque('abcdefg')
print('Deque:', d)
print('Length:', len(d))
print('Left end:', d[0])
print('Right end:', d[-1])

d.remove('c')
print('remove(c):', d)

Deque: deque(['a', 'b', 'c', 'd', 'e', 'f', 'g'])
Length: 7
Left end: a
Right end: g
remove(c): deque(['a', 'b', 'd', 'e', 'f', 'g'])


------------------

### 8. enum.Enum
- enum은 상수를 정의할수 있게 해주는 라이브러리
- 참고 : https://pythonkim.tistory.com/90
- 참고 또 : https://docs.python.org/3/library/enum.html

In [157]:
from collections import namedtuple
from enum import Enum

class Species(Enum):
    cat = 1
    dog = 2
    horse = 4
    aardvark = 5
    butterfly = 3
    owl = 6
    platypus = 7
    dragon = 8
    unicorn = 9
    
    kitten = 1
    puppy = 2

In [158]:
Enum?

[0;31mInit signature:[0m [0mEnum[0m[0;34m([0m[0mvalue[0m[0;34m,[0m [0mnames[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0;34m*[0m[0;34m,[0m [0mmodule[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mqualname[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mtype[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mstart[0m[0;34m=[0m[0;36m1[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m     
Generic enumeration.

Derive from this class to define new enumerations.
[0;31mFile:[0m           ~/anaconda3/lib/python3.6/enum.py
[0;31mType:[0m           EnumMeta


In [159]:
print(Species)
print(list(Species))

<enum 'Species'>
[<Species.cat: 1>, <Species.dog: 2>, <Species.horse: 4>, <Species.aardvark: 5>, <Species.butterfly: 3>, <Species.owl: 6>, <Species.platypus: 7>, <Species.dragon: 8>, <Species.unicorn: 9>]


In [161]:
print('Species.cat : ', Species.cat)
print('Species.kitten : ', Species.kitten)
print('Species.puppy : ', Species.puppy)

Species.cat :  Species.cat
Species.kitten :  Species.cat
Species.puppy :  Species.dog


In [162]:
print('Species.kitten.name : ', Species.kitten.name)
print('Species.kitten.value : ', Species.kitten.value)

Species.kitten.name :  cat
Species.kitten.value :  1


In [163]:
print('repr(Species.cat) : ', repr(Species.cat))
print('type(Species.kitten) : ', type(Species.kitten))

repr(Species.cat) :  <Species.cat: 1>
type(Species.kitten) :  <enum 'Species'>


In [165]:
>>> class Shake(Enum):
...     VANILLA = 7
...     CHOCOLATE = 4
...     COOKIES = 9
...     MINT = 3
...
>>> for shake in Shake:
...     print(shake, shake.name, shake.value)
...
Shake.VANILLA
Shake.CHOCOLATE
Shake.COOKIES
Shake.MINT

Shake.VANILLA VANILLA 7
Shake.CHOCOLATE CHOCOLATE 4
Shake.COOKIES COOKIES 9
Shake.MINT MINT 3


<Shake.MINT: 3>

In [166]:
print('Species(9) : ', Species(9))

Species(9) :  Species.unicorn


In [167]:
Animal = namedtuple('Animal', 'name age type')

In [168]:
perry = Animal(name="Perry", age=31, type=Species.cat)
perry

Animal(name='Perry', age=31, type=<Species.cat: 1>)

In [172]:
dragon = Animal(name="Drogon", age=4, type=Species.dragon)
dragon

Animal(name='Drogon', age=4, type=<Species.dragon: 8>)

In [173]:
tom = Animal(name="Tom", age=75, type=Species.cat)
tom

Animal(name='Tom', age=75, type=<Species.cat: 1>)

In [174]:
charlie = Animal(name="Charlie", age=2, type=Species.kitten)
charlie

Animal(name='Charlie', age=2, type=<Species.cat: 1>)

In [175]:
# And now, some tests.
print(charlie.type == tom.type)

print(charlie.type)

print(tom.type)

True
Species.cat
Species.cat


In [176]:
Species.cat == Species.kitten  # 값이 같으면 같은것으로 취급

True

In [177]:
# 값을 부르는 방법
print(Species(3))
print(Species['cat'])
print(Species.cat)

Species.butterfly
Species.cat
Species.cat


In [178]:
c = Species.cat
print(c)
# enum을 정수와 비교하는 것은 항상 False.
if c == c.value:                                # DIFF.
    print('SAME.')
else:
    print('DIFF.')

Species.cat
DIFF.


In [179]:
# enum을 반복문에 적용할수 있음
for name in Species:
    print(name)

Species.cat
Species.dog
Species.horse
Species.aardvark
Species.butterfly
Species.owl
Species.platypus
Species.dragon
Species.unicorn


~~사실 잘 모르겠다...~~

### 8. itemgetter

- itemgetter : 동일한 키 처리
- ‘fname’ key를 key값으로 읽는 itg를 생성해 서 실제 dict 타입을 파라미터로 주면 값을 결과로 제공

In [180]:
rows = [
    {'fname' : 'Brian', 'lname':'Jones', 'uid':1003},
    {'fname' : 'David', 'lname':'Beazley', 'uid':1002},
    {'fname' : 'John', 'lname':'Cleese', 'uid':1001},
    {'fname' : 'Big', 'lname':'Jones', 'uid':1004},
]

from operator import itemgetter
itg = itemgetter('fname')
print(dir(itg))
print(type(itg))
print(itg(rows[0]))

['__call__', '__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__']
<class 'operator.itemgetter'>
Brian


- **list.sort() vs sorted()**
    - list.sort() 는 리스트 내부에서 정렬.  
    - sorted() 는 정렬된 값을 반환.  
    - 원래 값을 유지하면서 정렬된 결과를 얻고 싶다면 sorted() 를 사용. 
    - list.sort() 는 값을 돌려주지 않기 때문에 받게 되면 None 을 받게 된다.   
    - list.sort() 는 리스트 형에 한해서만 동작, sorted() 는 iterable(순회가능) 한 자료형에 대해서 동작.

- itemgetter이용해서 sorting : 결과 값을 기준으로 dict 타입 원소를 가지는 list를 sorted 처리하기
    - 디셔너리에서 key, value 데이터를 정렬을 하고 싶을 때 -> 리스트로 변환하여 정렬
    - 기본적으로 sorted함수를 쓰면 해결됨
    - key에 의한 정렬이 아닌 value로 정렬하거나 내림차순으로 정렬하고 싶을때 sorted에 인자 넣어주기

### How to 정렬?
- https://docs.python.org/ko/3/howto/sorting.html

In [181]:
dict = {"abcde" : 7, "fzowe" : 5, "fko" : 5}
sortedArr = sorted(dict.items())
sortedArr

[('abcde', 7), ('fko', 5), ('fzowe', 5)]

In [183]:
rows = [
    {'fname' : 'Brian', 'lname':'Jones', 'uid':1003},
    {'fname' : 'David', 'lname':'Beazley', 'uid':1002},
    {'fname' : 'John', 'lname':'Cleese', 'uid':1001},
    {'fname' : 'Big', 'lname':'Jones', 'uid':1005},
    {'fname' : 'Big', 'lname':'alpha', 'uid':1004},
]

In [185]:
from pprint import pprint

In [186]:
itg = itemgetter('fname')
rows_by_fname = sorted(rows, key=itg)
# rows_by_fname = sorted(rows, key=itg, reverse=True)   # 내림차순 정렬

pprint(rows_by_fname)

[{'fname': 'Big', 'lname': 'Jones', 'uid': 1005},
 {'fname': 'Big', 'lname': 'alpha', 'uid': 1004},
 {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
 {'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
 {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}]


In [187]:
# set the sorted key using itemgetter

itg2 = itemgetter('fname', 'uid')
rows_by_fname2 = sorted(rows, key=itg2)

pprint(rows_by_fname2)

[{'fname': 'Big', 'lname': 'alpha', 'uid': 1004},
 {'fname': 'Big', 'lname': 'Jones', 'uid': 1005},
 {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
 {'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
 {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}]


- 튜플로 정렬~

In [190]:
tuples = [('kim',30), ('han',10), ('min',20), ('han',70), ('min', 90)]
tuples

[('kim', 30), ('han', 10), ('min', 20), ('han', 70), ('min', 90)]

In [191]:
tuples.sort(key=itemgetter(0,1))
print(tuples)

[('han', 10), ('han', 70), ('kim', 30), ('min', 20), ('min', 90)]


In [193]:
tuples = [('kim',30), ('han',10), ('min',20), ('han',70), ('min', 90)]
tuples

[('kim', 30), ('han', 10), ('min', 20), ('han', 70), ('min', 90)]

In [194]:
sorted_tuples = sorted(tuples, key=itemgetter(0,1))
sorted_tuples

[('han', 10), ('han', 70), ('kim', 30), ('min', 20), ('min', 90)]

In [195]:
tuples = [('kim',30), ('han',10), ('min',20), ('han',70), ('min', 90)]
tuples

[('kim', 30), ('han', 10), ('min', 20), ('han', 70), ('min', 90)]

In [196]:
tuples.sort(key=itemgetter(1, 0))
print(tuples)

[('han', 10), ('min', 20), ('kim', 30), ('han', 70), ('min', 90)]


### 9. attrgetter
- attrgetter에 class 속성을 부여하고 인스턴스를 파라미터로 받으면 그 결과값인 속성이 값을 가져옴

In [197]:
from operator import attrgetter

In [201]:
class User(object):
    def __init__(self, user_id):
        self.user_id = user_id
        
    def __repr__(self):
        return '유저({})....'.format(self.user_id)

In [202]:
x = attrgetter('user_id')
print(x)


users = [User(1), User(3), User(7)]
print(users)

operator.attrgetter('user_id')
[유저(1)...., 유저(3)...., 유저(7)....]


In [206]:
users = [User(3), User(1), User(7)]

x = sorted(users, key=attrgetter('user_id'))
print(x)

[유저(1)...., 유저(3)...., 유저(7)....]


In [207]:
sorted(users, key=lambda x: x.user_id)

[유저(1)...., 유저(3)...., 유저(7)....]

In [210]:
import time

def logging_time(original_fn):
    def wrapper_fn(*args, **kwargs):
        start_time = time.time()
        result = original_fn(*args, **kwargs)
#         print(result)
        end_time = time.time()
        print("WorkingTime[{}]: {} sec".format(original_fn.__name__, end_time-start_time))
        return result
    return wrapper_fn


@logging_time
def using_lambda():
    for i in range(10000000):
        sorted(users, key=lambda x: x.user_id)
        
#     return "ABC"
    
@logging_time
def using_attrgetter():
    for i in range(10000000):
        sorted(users, key=attrgetter('user_id'))
    
    
    
using_lambda()
using_attrgetter()

ABC
WorkingTime[using_lambda]: 7.673808813095093 sec
None
WorkingTime[using_attrgetter]: 7.359635829925537 sec
