# 2-2. 객체(Type)의 분류 2 - Sequence

## 2-2-1. Sequence Container Type

- 상식적으로 Sequence type은 내부적으로 어떠한 객체를 포함하고 있기에 Container Type이다.

- 기억 : sequence type의 객체들은 순서가 있다.

- 순서가 있으므로 인해 할 수 있는 2가지가 가능하다는 특징이 있다.
    - indexing(색인)
    - slicing(슬라이싱)
    
    
- non-sequencing type : 순서가 없다.

#### indexing(색인)

- indexing(색인)을 하기 위해서는 2가지 방법.

    1. 대괄호(\[ \])
    2. operator module의 getitem 혹은 \_\_getitem__ 메소드.


- mutable data인 경우 내부를 변경하기 위한 2가지 방법

    1. 할당
    2. operator module의 setitem 메소드


- IndexError
    - 인덱스는 타 언어의 배열과 같게 0 ~ n-1까지 존재. 이 범위를 벗어나면 IndexError 발생.
    
    
- Minus index
    - Circular하게 -는 뒤에서부터 시작. 즉, 0을 기준으로 
    
    - ... -3 -2 -1 0 1 2 3 ... 이러한 방식으로 계산.
    

In [23]:
# indexing

a = list(range(0,10))

a

print(a[0],a[5])

0 5


In [24]:
# IndexError
a[10]

IndexError: list index out of range

In [25]:
# operator module - getitem
# getitem(a,b) - a에 b번째 index를 반환한다.

import operator as op

print(op.getitem(a,3))
print(op.__getitem__(a,4))
print(a.__getitem__(5))

3
4
5


In [26]:
# 내부 변경

b = list(range(0,5))

b

[0, 1, 2, 3, 4]

In [28]:
b[0] = 2

b

[2, 1, 2, 3, 4]

In [32]:
# operator module - setitem
# setitem(a,b,c) - a의 b번째 index 값을 c로 변경.

import operator as op

op.setitem(b,2,999)
op.__setitem__(b,3,1000)
b.__setitem__(4,500)

b

[2, 1, 999, 1000, 500]

In [42]:
# - index

c = [1,2,3,4]

print(c[-1])

4


### Slicing

    - slice 객체를 통해 sequence 객체 내부의 특정 범위의 부분집합을 가져오는 것을 뜻한다.
    - 기본적인 literal은 색인 literal인 []안의 "a:b"를 통해서 쉽게 slice객체를 만들 수 있다.
    - 새로 만든 부분집합은 기존의 부분집합과 다른 객체이다.
    - None == 0
    - index와 같이 circular하기 때문에 (-)를 통해서 뒤에서부터 slicing 가능.
    - slice의 3번째 인자는 부분집합을 생성하는 범위의 step size를 정해줄 수 있다.
    - slice객체의 범위가 현재 sequence객체의 index범위를 벗어나도 가능하다.

In [40]:
# 일반적인 slicing
a = [0,1,2,3,4]

a1 = a[1:3]

print(a1, a is a1)

[1, 2] False


In [43]:
# Slice객체 만들기

b = [0,1,2,3,4]

s = slice(None, 3)
s1 = slice(0 , 3)

# s와 s1은 같다, 즉 None==0
print(b[s],b[s1])

[0, 1, 2] [0, 1, 2]


In [44]:
# None == 0

c = [0,1,2,3,4,5]

print(c[0:3],c[None:3],c[:3])

[0, 1, 2] [0, 1, 2] [0, 1, 2]


In [45]:
# -통해 거꾸로 slicing

d = [0,1,2,3,4]

print(d[-2:-1],d[-1:],d[4:-3])

[3] [4] []


    - d[4:-3]처럼 앞 index가 뒤 index보다 더 뒷 index를 접근하게되면 아무것도 담기지 않게 된다.

In [47]:
# Step Size

e = [0,1,2,3,4]

s = slice(0,4,2)

print(e[0:4:2],e[s])

# Step size가 딱 떨어지지않아도 가능.
print(e[0:4:3])

[0, 2] [0, 2]
[0, 3]


In [48]:
# index 범위를 벗어나도 slicing 가능

f = [0,1,2,3,4]

f[:2020]

[0, 1, 2, 3, 4]

#### Python의 경지

- python을 잘 쓰게된다면 이해되는 글귀들 모음

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


- "Although that way may not be obvious at first unless you're Dutch."

- 네델란드인이 아니라면 처음에는 명백하지 않을 것.
 
- 해석 : python의 창시자인 귀도반 로섬은 네델란드인.

- 즉, indexing은 정확해야하나 slicing은 영역을 대충잡아도 에러가 나지않게 구현해놓음.

#### Iterable형 Data Type

- Iterable은 "순회가능한"이란 의미로, 일반적인 언어의 용어로써 indexing이 가능한 Sequence 자료구조에 대해서 반복문을 통해서 하나씩 원소를 꺼내는 것을 뜻한다.
- 일반적으로 function signature를 보면 Iterable형 객체를 인자로 넣으라고 명시되어있기 때문에 개념만 다룰 예정임. 자세한 Iterrator객체는 generator단원에서 다룰 것이다.


In [5]:
# Function signature확인
# 순회가능한 (Iterable한) 객체를 넣어 하나하나씩 더한다는 의미.
help(sum)

Help on built-in function sum in module builtins:

sum(iterable, /, start=0)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.



- 일반적인 선수지식으로 Collection.abc 추상 클래스를 상속받는 클래스는 필수적으로 구현해야할 추상메소드가 존재한다.
- 물론, 각 자료구조(클래스)마다 실제 구현은 다 다르지만 추상 클래스의 특성상 이름은 똑같다.(오버라이딩)

- Sequence클래스와 Collection클래스를 보자

In [12]:
from collections.abc import Sequence, Collection

print(Sequence)
print(Collection)
print(Sequence.__abstractmethods__)
print(Collection.__abstractmethods__)

<class 'collections.abc.Sequence'>
<class 'collections.abc.Collection'>
frozenset({'__len__', '__getitem__'})
frozenset({'__contains__', '__iter__', '__len__'})


- 즉, Sequence클래스를 상속 받으려면 len과 indexing을 위한 메소드를 구현해야한다.
- Collection클래스를 상속 받으려면 앞선 메소드를 구현해야한다.

- 여기서 issubclass 메소드가 중요해지는데, 우리는 개념만 익히기 위함이기 때문에 list만 보기로 한다.

In [17]:
issubclass(list,Collection)

True

In [38]:
from collections.abc import Iterable

print(list.__name__+"은 "+Iterable.__name__+"을 상속받나요 ? ",issubclass(list,Iterable))
'__iter__' in dir(list)

list은 Iterable을 상속받나요 ?  True


True

- 즉, \_\_iter__이 존재한다 -> 그 자료구조는 iterable(순회가능)하다.

- 또한, 가장 큰 특징으로는 "순회가능"하다는 뜻은 "반복문"에서 하나씩 indexing하여 꺼내 올 수 있는지를 뜻하기 때문에 for반복문의 **in**뒤에 올 수 있어야 한다.(중요)

**그렇다면 왜? 우리는 iterable의 개념을 배우는가?**

   - **Lazy evaluation을 통한 메모리 안정성**이 가장 큰 이유이다.

- 사실, 결과만을 이용하려면 comprehension기법을 사용하는 것이 더 코드상 간단하고 좋다. 하지만, iterable인 generator를 사용하는 이유는 바로 big data를 메모리 상에 올릴 때 문제가 생기기 때문이다.

- Iterable객체는 메모리상에 lazy loading되기 때문에 메모리 제약을 덜 받는다.
    - eager loading : 일반 배열객체를 생성할 당시에 모두 메모리에 적재시킨다.
    - lazy loading : iterable객체를 지정한 객체와 그 규칙은 모두 담고 있지만, 생성당시 메모리에 할당하지 않고 꺼낼 때 메모리에 적재한다.

In [None]:
# 오래걸려서 실행은 안했지만 위는 메모리상에서 다 담을 수 없어 오류가 뜨고,
# 밑은 실행가능하다.
big_list = [i for i in range(1, 100000000000000000000+1)]
big_gen = (i for i in range(1, 10000000000000000000000000000+1))

- 이 다음 내용은 Comprehension과 Generator단원에서 더 자세하게 다루겠다.