# 2 Built-in Sequence Types

Sequence 타입은 다음과 같은 속성을 가진다. 

1. Membership 연산: `in` 사용
2. Size 함수: `len(foo_seq)`
3. Slicing 속성: `seq[:-1]`
4. Iterability: 반복문에 있는 데이터를 순회

Python엔 다음과 같은 내장 sequence 타입이 있다. 

1. str
2. tuple
3. list
4. byte array
5. byte

named tuple은 `collections` 모듈에서 사용 가능. 

In [4]:
bytearray()

bytearray(b'')

In [5]:
bytes()

b''

## 2.1 Slicing and Deep Copy

### 2.1.1 mutability

### Call by value VS Call by reference

Actually, Python is 'call by assignment'.

Call by value의 경우 인수로 전달되는 변수가 가지고 있는 값을 함수 내의 매개변수가 '복사' 하는 방식이다. 이제 서로 완전히 별개의 변수가 된다. 따라서 함수 내의 매개변수 조작은 인수로 전달되는 변수에 아무런 영향을 미치지 않는다. 

Call by reference의 경우 인수로 변수의 값을 전달하지 않고 변수의 주소값을 전달한다. 즉, 함수 내의 parameter(매개변수)에 argument(인수)로 전달된 변수의 원래 주소값을 저장하는 것이다. 그래서 함수 내에서 전달된 값을 변화시킬 수 있다. 

In [8]:
a = 1
b = [1,2,3]

In [13]:
def change_value(foo):
    print(f"Before the change, value is: {foo}")
    if isinstance(foo, int): # Immutable
        foo += 10 
        print(f"After the change, value is: {foo}")
    elif isinstance(foo, list): # Mutable
        foo[1] = 10
        print(f"After the change, value is: {foo}")

In [11]:
change_value(a)
a

Before the change, value is: 1
After the change, value is: 11


1

In [12]:
change_value(b)
b

Before the change, value is: [1, 2, 3]
After the change, value is: [1, 10, 3]


[1, 10, 3]

Python의 경우 call by assignment이기 때문에 

- immutable 객체가 argument로 전달되면 처음엔 call by reference로 받지만 값이 변경되면 call by value로 동작한다. 
- mutable 객체가 argument로 전달되면 그냥 call by reference로 계속 동작한다. 

이제 mutability에 대해 본격적으로 봐보겠다. 

In [6]:
a = 1
id(a)

140735010677136

In [7]:
a += 1
id(a)

140735010677168

int, string, tuple 과 같은 immutable에 속한 객체들은 값이 변경될 때 객체가 변한다. 

이 객체들은 call by value의 속성을 가진다. 

In [1]:
b = [1,2,3]
id(b)

2148252232712

In [2]:
b += [4]
b

[1, 2, 3, 4]

In [3]:
id(b)

2148252232712

In [10]:
c = b
id(c)

2148252232712

In [9]:
c = copy.copy(b)
id(c)

2148251724168

list, dictionary 등은 mutable에 속한다. 값이 변경될 때 객체의 값이 변한다. 

객체는 유지된다. id가 같은걸 보면 알 수 있다. 

이 객체들은 call by reference의 속성을 가진다

- 일반적으로 immutable이 mutable보다 효율적이다. 
- 일부 collection data type은 immutable로 인덱싱할 수 있다. 

#### Deep Copy vs Shallow Copy

The difference between shallow and deep copying is only relevant for compound objects (objects that contain other objects, like lists or class instances):

- A shallow copy constructs a new compound object and then (to the extent possible) inserts references into it to the objects found in the original.

- A deep copy constructs a new compound object and then, recursively, inserts copies into it of the objects found in the original.

List 의 경우 일단 다음처럼 copy할 수 있다. 

In [19]:
myList = [1, 2, 3, 4]
id(myList)

2148253486024

In [20]:
newList = myList[:] # Shallow copy
id(newList)

2148253394888

In [21]:
newList2 = list(myList)
id(newList2)

2148253496072

모두 shallow copy이다.

기타 객체에 대해선 `copy` 모듈을 쓸 수 있다. 

`deepcopy`도 확인해보자. 

In [46]:
import copy

a = [[1,2],[3,4]]
id(a)

2148252553608

In [47]:
shallow = copy.copy(a)
id(shallow)

2148252548744

In [48]:
deep = copy.deepcopy(a)
id(deep)

2148253509128

일단 당연히 셋 모두 id는 다르다. 새로 생성된 객체니까. 

하지만 내부의 객체는 shallow의 경우 reference되었고 deep의 경우 copy되었다. 

이는 mutable 객체 내부에 mutable 객체가 들어있었기 때문이다. 

In [49]:
id(a[0])

2148252548424

In [50]:
id(shallow[0])

2148252548424

In [51]:
id(deep[0])

2148252554056

일반적인 객체로도 확인해보자. 

In [52]:
class Foo:
    def __init__(self):
        self.bar = [1,2,3]

In [54]:
a = Foo()
shallow = copy.copy(a)
deep = copy.deepcopy(a)

In [55]:
id(a.bar)

2148252514504

In [56]:
id(shallow.bar)

2148252514504

In [57]:
id(deep.bar)

2148252233096

### 2.1.2 Slicing

생략

## 2.2 String

string = sequence of characters. 

파이썬의 모든 객체에는 두 가지 출력 형식이 있다. 

1. 사람을 위한 표현, string 형식
2. 인터프레터에서 사용하는 문자열, representational 형식

### 2.2.1 Unicode

2.7에서는 기본 문자열이 바이트였지만 python 3부터는 유니코드이다. 이게 얼마나 편한지 모른다.

### 2.2.2 string method

In [58]:
a = ['foo', 'bar', 'cake']
"*".join(reversed(a))

'cake*bar*foo'

In [64]:
reversed(a)

<list_reverseiterator at 0x1f42de2f248>

In [65]:
a[::-1] # 다르다. 

['cake', 'bar', 'foo']

`ljust`, '`rjust`는 왼쪽/오른쪽부터 width만큼 채운다. 

In [67]:
print('cake'.ljust(10, '-'))
print('is great'.ljust(10, '-'))

cake------
is great--


#### 기타 매소드 

In [69]:
'Hello World'.swapcase()

'hELLO wORLD'

f-string 추가 기능

In [70]:
from datetime import datetime

today = datetime.today()

f'{today:%B %d, %Y}'

'December 01, 2020'

## 2.3 tuple

중간 생략

### 2.3.3 Named Tuple

`collections`에 있는 sequence data type

튜플항목을 이름으로도 참조 가능. 

In [71]:
from collections import namedtuple

In [75]:
Person = namedtuple('person', ['name', 'age', 'gender'])

In [76]:
p = Person(name='John', age=3, gender='male')

In [77]:
p

person(name='John', age=3, gender='male')

In [78]:
p.name

'John'

## 2.4 List

`append()`, `pop()`의 시간 복잡도는 O(1)이다. 

리스트 항목을 검색해야 하는 `remove()`, `index()`, 멤버십 테스트 `in`은 O(n)이다. 

`insert()`도 지정 인덱스에 항목 삽입 후 이후 인덱스를 한칸씩 뒤로 밀어야 하므로 O(n)이다. 


### 2.4.1 list method

In [83]:
foo = ['cake', 'egg', 'ham']

foo.pop(0)

'cake'

In [84]:
foo

['egg', 'ham']

참고로 `dict`도 `pop()`이 된다. 

In [86]:
foo = {'cake': 1, 'egg': 2, 'ham': 3}
foo.pop('cake')

1

In [89]:
foo.pop('ninja', 'No key in the dict') # key가 없을 때도 지정할 수 있다. 

'No key in the dict'

In [92]:
foo = [1,4,2,6,54,8,6,3,]

foo.sort(reverse=True, key=None)

In [93]:
foo

[54, 8, 6, 6, 4, 3, 2, 1]

필요하면 key를 지정 가능하다. 

함수로 넣어줄 수 있다. lambda 같이.

### 2.4.3 list comprehension

성능이 더 좋긴 하지만 가독성을 고려해 적절히 쓰도록 한다. 

좋은 practice가 있어 써보겠다. 

In [99]:
foo = list(range(10))

In [102]:
[x for x in foo
 if x % 2 == 0] # 한 줄로 적지 말고 이렇게 두 줄로 띄어 쓰자. 

[0, 2, 4, 6, 8]

## 2.5 byte and bytearray

생략

연습문제도 생략하겠다. 

별로 문제 질이 좋지 않다.