#### list

- 크기나 내용 변경 가능
- 대괄호 []나 list 함수를 사용해서 생성 가능

In [1]:
a_list = [2, 3, 7, None]
tup = ('foo', 'bar', 'baz')
b_list = list(tup)

In [2]:
b_list

['foo', 'bar', 'baz']

In [3]:
b_list[1] = 'peekaboo'

In [4]:
b_list

['foo', 'peekaboo', 'baz']

- 리스트와 튜플은 의미적으로 비슷하나(튜플은 수정불가) 객체의 1차원 순차 자료형이며 많은 함수에서 교차적으로 사용할 수 있음
- 이터레이터나 제너레이터 표현에서 실제 값을 모두 담기 위한 용도로 자주 사용됨

In [5]:
gen = range(10)

In [6]:
gen

range(0, 10)

In [7]:
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

#### 원소 추가, 삭제

>append : list 끝에 새로은 값 추가

In [8]:
b_list.append('123')

In [9]:
b_list

['foo', 'peekaboo', 'baz', '123']

>insert : 리스트의 특정 위치에 값을 추가
- insert는 append에 비해 연산 비용이 많이 듬
- 순차형 자료형의 시작과 끝지점에 원소를 추가하고 싶으면 양방향 큐인 collections.deque 사용이 좋음

In [10]:
b_list.insert(1, 'red')

In [11]:
b_list

['foo', 'red', 'peekaboo', 'baz', '123']

>pop : 특정 위치의 값을 반환하고 해당값을 리스트에서 삭제

In [12]:
b_list.pop(2)

'peekaboo'

In [13]:
b_list

['foo', 'red', 'baz', '123']

>remove : 리스트에서 제일 앞에 위치한 값부터 삭제

In [14]:
b_list.append('foo')

In [15]:
b_list

['foo', 'red', 'baz', '123', 'foo']

In [16]:
b_list.remove('foo')

In [17]:
b_list

['red', 'baz', '123', 'foo']

>in : list에 어떤 값이 있는지 검사   
not : list에 어떤 값 없는지 검사
- 리스트의 모든 값 일일이 검사해야하므로 속도가 많이 느림

In [18]:
'a' in b_list

False

In [19]:
'red' in b_list

True

In [20]:
'red' not in b_list

False

#### 리스트 이어붙이기

>`+` 연산자 : 두개 리스트 합함

In [21]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

> `extend` method : list 미리 정의해 둔 경우, 여러개 값 추가 가능
- `+`로 리스트 이어 붙일 경우, 새로운 리스트 생성하고 값 복사하게 되므로 연산비용이 높음
- 큰 리스트일 수록 `extend`메서트로 기존의 리스트에 값을 추가하는 것이 일반적으로 용이

In [22]:
x = [4, None, 'foo']

In [23]:
x.extend([7, 8, (2, 3)])

In [24]:
x

[4, None, 'foo', 7, 8, (2, 3)]

In [25]:
list_of_lists = [1, 2, 3, 4, 5, 6, 7, 8, 9]

everything = []

for chunk in list_of_lists  :
    everything.append(chunk)

everything

[1, 2, 3, 4, 5, 6, 7, 8, 9]

정렬

>sort : 새로운 리스트를 생성하지 않고 있는 그대로 리스트를 정렬할 수 있음

In [26]:
a = [7, 2, 5, 1, 3]

a.sort()

In [27]:
a

[1, 2, 3, 5, 7]

In [28]:
b = ['sam', 'small', 'He', 'foxes', 'six']

b.sort(key=len)

b

['He', 'sam', 'six', 'small', 'foxes']

이진 탐색과 정렬된 리스트 유지하기

내장 bisect 모듈은 이진 탐색과 정렬된 리스트에 값을 추가하는 기능

> bisect.bisect : 값 추가될 때 리스트가 정렬된 상태를 유지할 수 있는 위치 반환   
> bisect.insort : 실제로 정렬된 상태를 유지한 채 값 추가
- bisect 모듈 함수 ) 연산비용이 높을 수 있음

In [29]:
import bisect

c = [1, 2, 2, 3, 3, 4, 7]

In [30]:
bisect.bisect(c, 2)

3

In [31]:
bisect.bisect(c, 5)

6

In [32]:
bisect.insort(c, 6)

In [33]:
c

[1, 2, 2, 3, 3, 4, 6, 7]

슬라이싱

>slice: 리스트와 같은 자료형(배열, 튜플, ndarray)은 색인 연산자 []안에 start:stop을 지정해서 원하는 만큼 잘라낼 수 있음

In [34]:
seq = [7, 2, 3, 7,5 ,6, 0, 1]

In [35]:
seq[1:5]

[2, 3, 7, 5]

In [36]:
seq[3:4] = [6, 3]
seq

[7, 2, 3, 6, 3, 5, 6, 0, 1]

In [37]:
seq[:5]

[7, 2, 3, 6, 3]

In [38]:
seq[3:]

[6, 3, 5, 6, 0, 1]

In [39]:
seq[-4:]

[5, 6, 0, 1]

In [40]:
seq[-6:-2]

[6, 3, 5, 6]

In [41]:
seq[::2]

[7, 3, 3, 6, 1]

In [42]:
seq[::-1]

[1, 0, 6, 5, 3, 6, 3, 2, 7]

#### 내장 순차 자료형 함수

>enumerate
- 순차 자료형에서 현재 아이템의 색인을 함께 처리할때 사용
>```python
>i = 0
>for i, value in enumerate(collection) :
>    # value를 사용하는 코드 작성
>```
- 색인을 통해 데이터에 접근할 때 enumerate를 사용하는 유용한 패턴은 순차적 자료형에서 값고 그 위치는 dict에 넘겨주는 것

In [45]:
some_list = ['foo',  'bar', 'baz'] 

mapping = {}

for i, v in enumerate(some_list) :
    mapping[v] = i

In [46]:
mapping

{'foo': 0, 'bar': 1, 'baz': 2}

> sorted : 정렬된 새로운 순차 자료형 반환  
>- list의 sort메서드와 같은 인자 가짐

In [47]:
sorted([7,1,2,6,0,3,2])

[0, 1, 2, 2, 3, 6, 7]

In [48]:
sorted('horse race')

[' ', 'a', 'c', 'e', 'e', 'h', 'o', 'r', 'r', 's']

>zip : 여러 개의 리스트와 튜플 또는 다른 순차 자료형을 서로 짝지어 튜플의 리스트 생성

In [50]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']

In [51]:
zipped = zip(seq1, seq2)

In [52]:
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

여러 개의 순차 자료형을 받을 수 있으며, 반환되는 리스트의 크기는 넘겨 받은 순차 자료형 중 가장 짧은 길이로 정해짐

In [56]:
seq3 =[False, True]

In [57]:
list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

여러 개의 순차 자료형을 동시에 순회하는 경우 enumerate와 함께 사용되기도 함

In [58]:
for i, (a, b) in enumerate(zip(seq1, seq2)) :
    print('{0} : {1}, {2}'.format(i, a, b))
    

0 : foo, one
1 : bar, two
2 : baz, three


zip함수로 짝지어진 순차 자료형을 다시 풀어낼 수 있음  
이를 이용해 리스트의 로우를 리스트의 칼럼으로 변환하는 것도 가능

In [59]:
pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt')]

In [60]:
first_name, last_names = zip(*pitchers)

In [61]:
first_name

('Nolan', 'Roger', 'Schilling')

In [62]:
last_names

('Ryan', 'Clemens', 'Curt')

>reversed : 순차형 자료형을 역순 순회

In [63]:
list(reversed(range(10)))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

참고 자료
> Python for Data Analysis(2019), 한빛미디어