# 2-5. Container 형 DataType(List, Tuple, Dict, Set) 살펴보기.

- 앞서 분류를 통해 Container형 built-in class를 하나하나씩 살펴보자.
- 이 내용은 [파이썬 표준 라이브러리 - 내장형](https://docs.python.org/ko/3/library/stdtypes.html#built-in-types) 문서에서 확인할 수 있다.

## 2-5-1. 배열형 자료형 - [List](https://docs.python.org/ko/3/tutorial/datastructures.html#more-on-lists)

- List는 heterogenous container type, sequence type, mutable, iterable한 자료형이다.

- 내부 item으로는 object형 객체를 받을 수 있어, python의 모든 것은 object이기 때문에 모든 것을 item으로 넣을 수 있다.

- 관련 메소드 :
    1. 삭제 : pop, remove, clear
        - pop() : 마지막 원소를 삭제, index를 통해서 특정 index의 원소를 삭제 할 수도 있음.
        - remove() : 특정 원소를 삭제, 만약 여러개라면 제일 첫 번째 값을 삭제
        - clear : 모든 원소 삭제 메소드.
    2. 추가 : append ,insert
        - append : index의 마지막에 인자로 넣은 원소를 추가.
        - insert(idx,a) : list의 idx번째 index에 a를 넣는다-> 원래값은 한칸 뒤로 밀림.
        
    3. + , extend, *:
        - a + b : list a,b에 대해서 a, blist내부 원소를 concatenate 한다.
        - a.extend(b) : a뒤에 b를 concatenate한다. 
        - a * b : a가 list고 b가 숫자형일때 a를 b만큼 반복.
        
    4. 그 외 :
        - sort : 오름차순으로 정렬(default)
        - reverse : 거꾸로 뒤집기.
        - ... 등등 이외에도 많다.
        
- 주의 :
    1. indexing을 통한 할당으로는 새로운 원소를 추가할 수 없다.(재할당은 가능) - IndexError
    2. mutable객체이기 때문에 return값 3가지 경우에 대해 주의 - 자기자신이 바뀔 수 있어 "재할당의 관점"이 아니라서 메모리주소 id()값이 같다.
    

In [2]:
# 주의 1.

a  = [1,2,3,4,5]

a[6] = 2

IndexError: list assignment index out of range

## 2-5-2. 배열형 자료형 - Tuple , Namedtuple

- tuple : heterogenous container type, sequence type, iterable, **immutable**한 자료형이다.
- namedtuple : index에 이름을 부여해 이름으로 원소를 접근 가능하게 한 튜플.
    - 생성 : collections.namedtuple로 튜플을 만드는 클래스 작성
    - 참조 : "튜플이름"."index이름(원소이름)"으로 접근.
    - custom class : typing.NamedTuple상속을 통해 생성가능.
    - pandas의 columns을 이러하게 조회가능.

In [14]:
# namedtuple 생성
import collections as cols

# namedtuple을 만드는 "클래스" 생성.
# NamedTuple => class
NT = cols.namedtuple("NamedTuple","x,y,z")
print(type(NT))


#만든 class로 객체생성
nt = NT(1,2,3)

#접근
print(nt.x,nt.y,nt.z)
print(nt[0],nt[1],nt[2])

<class 'type'>
1 2 3
1 2 3


In [15]:
# custom class 생성.

import typing

class CusNamedTuple(typing.NamedTuple):
    x : int
    y : int
    z : int
        

c = CusNamedTuple(1,2,3)

print(c.x, c.y, c.z)
print(c[0],c[1],c[2])

1 2 3
1 2 3


In [16]:
# namedtuple또한 tuple
isinstance(c,tuple)

True

### c.f. Type Hint( 파이썬에서 변수에 특정 자료형을 type으로 지정하는 방식 제공)

- : 를 통해서 datatype의 hint를 지정 가능.
- \_\_annotations__를통해서 함수에서 보관한 type hint 볼 수 있다.
- python 3부터 지원이 되었으며, 잘 안쓴다.
- 함수에서 arrow function처럼 ->를 통해서 return에 대한 type hint 작성가능.

- 주의 :
    - 변수의 정의와 선언이 아니라 변수에 관한 "주석"을 추가하는 기능 - 할당을 해야된다.
    - "주석"이기 때문에 다른 type의 변수를 할당해도된다. -> recommandation(권장)의 개념임.
    - 함수 내부의 type hint는 볼 수 없다.
    

In [18]:
# Type hint는 정의가 아니다. 따라서 할당해야함

x : int
    
x

NameError: name 'x' is not defined

In [19]:
x : int
x = 2
x

2

In [20]:
x : int
x = "324"
x

'324'

In [28]:
# 내부의 type hint는 볼 수 없다.
def add(x : int , y: int) -> int:
    z : int
    z = x +y
    return z

add.__annotations__# z 없음.

{'x': int, 'y': int, 'return': int}

### 배열형 자료형 특징을 이용한 간단한 queue class만들기.

In [32]:
class Queue:
    def __init__(self):
        self._list = []
    def empty(self):
        return True if len(self._list) ==0 else False
    def pop(self):
        if len(self._list) ==0:
            return 0
        else :
            return self._list.pop(-1)
    def insert(self,value):
        return self._list.insert(0,value)
    def getQueue(self):
        return self._list.copy()
    
q = Queue()
print(q.empty())
q.insert(2)
print(q.getQueue())
print(q.pop())
print(q.getQueue())

True
[2]
2
[]


## 2-5-3. { }를 사용하는 자료형 - Dictionary


- key(키)와 value(값)으로 mapping되어있는 mapping형 객체이다.
    - cols.abc.Mapping을 상속받아서 만듬
    - key 값으로는 hashable(해시가능)한 객체를 사용한다.
        - hashable이란 immutable한 객체가 서로 unique해서 "비교"를 할 수 있는 객체를 뜻한다.
        - 즉, key는 중복이 없고 immutable객체를 사용한다. (tuple, str, 숫자형)
        - 숫자형 같은 경우 ==(같다)라고 비교가 가능하기 때문에 key로 1과 1.0을 넣을 수 있지만, 컴퓨터는 부동소수점을 근삿값으로 계산하기 때문에 추천하지 않는 방법임.


- Dictionary는 mutable, non-sequence, iterable, heterogeneous container type이다.
    - 순서가 없기 때문에 indexing, slicing이 불가하다. -> key를 통해서 value를 참조한다.
    - mutable이기 때문에, 항상 (key,value)쌍을 추가,삭제,변경할 수있다.
    

- Dictionary의 생성 
    1. literal {}를 사용.
    2. dict() instance화.
    
    
- 추가 :
    1. {key :value}형태의 dictionary 객체를 update메소드를 통해 추가.
    2. d\[key\] = value형태로 추가.
    
    
- 검색 :
    1. dict\[key\]로 참조 -> key가 없으면 KeyError를 일으킴.
    2. get 메소드 사용 - key가 있으면 해당 key의 value 반환, key가 없으면 None혹은 default설정했다면 default값 반환
    3. setdefault 메소드 사용 - key가 있으면 해당 key의 value 반환, key가 없으면 None 혹은 default 값을 반환하면서 dict에 default값 추가.
    
    
- 삭제 :
    1. clear : dict의 모든 항목 제거
    2. pop : 해당하는 key를 제거하고 value를 돌려줌.
    3. popitem : LIFO로 (key,value)쌍을 돌려줌.
    
    
- 그외 :
    1. reversed : 역순으로 반환.
    
    
- 주의 :
    - dictionary객체 name 자체를 iterable객체를 필요로 하는 데 넣으면 key값을 기준으로 iterate한다.
        - 따라서, dictionary view를 통해서 key,value,item을 각각 iterable하게 꺼낼 수 있다.
    - key의 특성때문에 중복된 key를 추가한다면 내부적으로 하나를 삭제함.
    - 순서가 없기 때문에 내부적으로 sorting해서 주지만 우리가 순서를 바꿀 수 는 없음.
         - 좀 더 정확히는 LIFO를 따름.(3.7버전 이후부터)
         - 그래서 나온 것이 OrderedDict class
    - keys들의 특성 때문에, 합집합(|)연산이 가능함.

In [34]:
# Dictionary의 생성
# 순서가 없다.

a = dict(one=1, two=2, three=3)
b = {'one': 1, 'two': 2, 'three': 3}
d = dict([('two', 2), ('one', 1), ('three', 3)])
e = dict({'three': 3, 'one': 1, 'two': 2})
f = dict({'one': 1, 'three': 3}, two=2)
a == b == c == d == e == f

True

In [43]:
# 주의1.
dic = {'one': 1, 'two': 2, 'three': 3}

print(1 in dic)
print('one' in dic)

False
True


In [64]:
# 주의 4.
dic1 = {'one':1}
dic2 = {'two' :2 }
print(dic1 | dic2)

{'one': 1, 'two': 2}


### Dictionary view object(뷰 객체)

- dict.keys() : key값을 돌려줌
- dict.values() : value값을 돌려줌
- dict.items() : (key,value) 쌍을 가지는 tuple을 돌려줌.
    - unpacking가능.
    
    
- iterable하기 때문에 in뒤에 사용가능.

### OrderedDict class

- sequence한 Dictionary 
- Dictionary이기 때문에 Mapping형 객체이다.
- collections module을 import

- dictionary view를 통해서 iterable 객체로 사용가능.
- update하는 순서대로 원소가 저장됨

In [68]:
# ordereddict
import collections as cols

print(cols.OrderedDict)

issubclass(cols.OrderedDict,cols.abc.Mapping)

<class 'collections.OrderedDict'>


True

In [79]:
# 생성
dd = {'a' :1,'b':2,'c':3}
od = cols.OrderedDict(dd)
print(od)
print(od.items())

OrderedDict([('a', 1), ('b', 2), ('c', 3)])
odict_items([('a', 1), ('b', 2), ('c', 3)])


### Counter Class

- 같은 원소를 몇 개 가졌는지를 알 수 있는 Datatype
- +, -연산 사용가능.
- mapping 추상클래스를 상속.

In [80]:
import collections as cols

issubclass(cols.Counter, cols.abc.Mapping)

True

In [82]:
l = [1,1,1,3,3,4,4,4]
c = cols.Counter(l)
print(c)

# Mapping이기 때문에 key를 통해서 value값 찾기가능.
print(c[1])

Counter({1: 3, 4: 3, 3: 2})
3


In [83]:
# +,-지원
d = c+c
print(d)
e = c-c
print(e)

Counter({1: 6, 4: 6, 3: 4})
Counter()


## 2-5-4. { }를 사용하는 자료형 - Set과 Frozenset

- Set : 집합
    - 집합의 특성 : 중복이 없고, 순서가 없다. => 이 특성을 그대로 가져옴.
    - 집합 연산을 위해 dictionary의 key를 모티브로 만들어졌다.
    - 따라서 내부 원소들은 **hashable**하다.
    
    
- set : mutable, non-sequence, iterable, heterogenous type
- frozenset : **immutable**, non-sequence, iterable, heterogenous type


- set 생성:
    - literal :이 없는 {}
    - set()를 통한 instance화
    - 공집합 
        - dictionary가 먼저 만들어졌기 때문에 빈 {}는 dictionary임. 따라서 공집합을 만들 때는 set()를 통해 만들어야됨.
        
- 연산 : 자세한건 공식문서의 set section확인.
    - 일반적인 집합연산(합집합,교집합,차집합,부분집합,진부분집합,대칭차집합,두 집합의 교집합의 유무)을 모두 지원한다.
        - 연산자를 사용 : |,&,-,>=,<=,^ 등을 쓸 수있다.
        - 메소드를 사용 : union,intersection, ... 등등
        - 공식문서에서는 연산자를 사용하는 연산보다 메소드를 사용하는 연산을 더 권장.
            - 이유 : 메소드를 사용하면 iterable객체를 내부적으로 set으로 바꿔주면서 연산. 하지만 연산자를 사용하면 두 객체가 무조건 set 혹은 frozenset이어야 한다.
    - set과 frozenset의 서로의 비교 및 연산이 가능하다.


- 주의 :
    - set은 mutable이기때문에 set자체가 set의 원소로 넣을 수 없다.(frozenset은 가능)
    - 내부적인 순서가 존재하고 중복에 대한 처리도 내부적으로 이루어져서 순서에 대해서는 우리가 변경할 수 없음.
    - frozenset은 immutable, set은 mutable. 따라서, set만 사용하는 내부를 변경시키는 method가 존재한다.( *\_update )

### 간단한 Heap자료구조 처리하기.

In [89]:
class Heap:
    def __init__(self):
        self._dict={}
    def empty(self):
        return True if len(self._dict) == 0 else False
    
    def pop(self,key):
        if self._dict.get(key,0):
            return self._dict.pop(key)
        else :
            return 0
    def push(self,key,value):
        return self._dict.setdefault(key,value)
    def getHeap(self):
        return self._dict.copy()
    
h = Heap()
print(h.empty())
h.push("가을",100)
print(h.getHeap())
print(h.pop("가을"))
print(h.getHeap())


True
{'가을': 100}
100
{}


## 2-5-5. 범위(scope)를 처리하는 Class

- slice와 range
    - 모두 Class
    - slice : slicing을 하기 위한 속성을 가짐.
    - range : iterable객체의 특성을 가짐(\_\_len__,\_\_getitem__,**\_\_iter__**)

In [99]:
# slice 속성 알아보기
s = slice(0,10)
print(set(dir(s)) - set(dir(object)))

print(s.step)
print(s.start)
print(s.stop)

{'stop', 'step', 'start', 'indices'}
None
0
10


In [100]:
# range속성 알아보기
r = range(10)
print(set(dir(r)) - set(dir(object)))

{'step', 'stop', 'count', 'index', '__len__', '__iter__', '__bool__', '__contains__', '__reversed__', '__getitem__', 'start'}
