# Chapter 6 : 자료구조 (리스트, list)

- `리스트(list)` : 순서가 있고, 원소를 수정할 수 있는 자료구조
- 비슷한 자료구조로, "배열(Array)"이 있음
- 리스트는 "가변 길이" 자료구조

## 1. 생성

- 대괄호 `[]` 를 이용하여 생성

In [1]:
fruits = ['banana', 'orange', 'apple']
print(fruits)
print(type(fruits))

['banana', 'orange', 'apple']
<class 'list'>


- 리스트는 "모든" 자료형을 저장할 수 있음

> 이후에 나오는 모든 자료구조도 동일!

In [2]:
# 서로 다른 자료형을 저장할 수 있음
any_items = ['kiwi', 321, 1.23]
print(any_items[0])
print(any_items[-1])

# 리스트 안에 리스트를 저장할 수도 있음
list_2 = [1, 2, 3, [4, 5, 6]]
print(list_2[-1])

kiwi
1.23
[4, 5, 6]


## 2. 원소 접근

- 각 원소는 `[]` 와 `인덱스(index)`를 이용하여 원소에 접근

> 리스트를 생성하는 대괄호와 다름!!

In [3]:
# 컴퓨터 세계에서는 첫 번째 자리는 '0' 부터 시작
fruits = ['banana', 'orange', 'apple']
print(fruits[0])

# 음수를 이용하여 맨 뒤에서부터 원소에 접근할 수 있음
print(fruits[-1], fruits[-2])


# 리스트 안에 리스트의 원소를 접근할 때는 대괄호를 한번 더 사용하면 됨
# --> 가져온 데이터가 리스트 이므로, 대괄호로 다시 접근하여 원소를 가져오는 것
list_2 = [1, 2, 3, [4, 5, 6]]
print(list_2[-1][1])

# 다중 리스트는 데이터 접근이 복잡하기 때문에 자주 사용되지 않음
list_3 = [1, 2, [['apple', 'orange'], 'a', 'b', 'c'], 3, 4]
# 'orange' 에 접근하려면 아래 처럼 인덱싱 해야함
print(list_3[2][0][1])

banana
apple orange
5
orange


- `인덱스 슬라이싱(index slicing)` : `콜론(:)` 을 이용하여 여러 원소를 한번에 조회할 수 있음
- `[시작:끝]` 형태로 사용하며, 시작 위치의 원소부터 끝 위치 직전 원소까지 조회
- `시작` 을 생략하면 "첫 번째부터", `끝` 을 생략하면 "마지막까지"를 의미

In [4]:
foods = ['pizza', 'hamburger', 'salad', 'chicken', 'pasta']
print(foods[1:3])
print(foods[:2])
print(foods[2:])

['hamburger', 'salad']
['pizza', 'hamburger']
['salad', 'chicken', 'pasta']


## 3. 리스트 수정

- `인덱스` 또는 `인덱스 슬라이싱` 으로 접근한 원소는 직접 수정할 수 있음
- 하지만, 자주 사용되는 방법은 아님!

In [5]:
# 인덱스로 접근하여 값을 수정
items = [1, 2, 3, 4, 5]
items[1] = 11
print(items)

# 인덱스 슬라이싱으로 접근하여 값을 수정
items[2:4] = [22, 33]
print(items)

[1, 11, 3, 4, 5]
[1, 11, 22, 33, 5]


- `list.append(L, D)` : 리스트 `L` 맨 뒤에 데이터 `D` 를 추가

In [6]:
items = [1, 2, 3]
list.append(items, 11)
print(items)

# 문자열과 마찬가지로, "items.append(11)" 과 같이 사용할 수 있음
items.append(22)
print(items)

[1, 2, 3, 11]
[1, 2, 3, 11, 22]


- `list.insert(L, IDX, D)` : 리스트 `L` 의 `IDX` 위치에 데이터 `D` 를 추가

In [7]:
items = [1, 2, 3]
list.insert(items, 1, 11)
print(items)

[1, 11, 2, 3]


- `list.remove(L, I)` : 리스트 `L` 에서 데이터 `I` 를 찾아 삭제
- 맨 앞에서 찾기 시작하여 제일 먼저 발견한 데이터 1개만 삭제
- 만약 해당 데이터가 없는 경우, `ValueError` 예외가 발생

In [8]:
items = [1, 2, 3, 1, 2, 3]
list.remove(items, 2)
print(items)

[1, 3, 1, 2, 3]


In [9]:
items = [1, 2, 3, 1, 2, 3]
items.remove(11)

ValueError: list.remove(x): x not in list

- `list.pop(L)` : 리스트 `L` 의 마지막 원소를 삭제한 후, 해당 데이터를 반환
- `list.pop(L, IDX)` : 리스트 `L` 의 `IDX` 위치의 원소를 삭제한 후, 해당 데이터를 반환

In [10]:
items = [1, 2, 3, 4]
it = list.pop(items)
print(items)
print(it)

[1, 2, 3]
4


In [11]:
items = [1, 2, 3, 4]
it = items.pop(1)
print(items)
print(it)

[1, 3, 4]
2


- `list.clear(L)` : 리스트 `L` 의 모든 원소를 삭제

In [12]:
items = [1, 2, 3, 4, 5]
print(items)
items.clear()
print(items)

[1, 2, 3, 4, 5]
[]


- `list.extend(L1, L2)` : 리스트 `L1` 맨 뒤에 리스트 `L2` 의 모든 원소를 추가
- `L1 + L2` 와 비슷하나, `+` 는 같은 리스트 자료형만 가능하며, 두 리스트를 합쳐서 새로운 리스트를 생성하는 것

> `L2` 는 "반복 가능한(Iterable)" 자료구조라면 무엇이든 올 수 있습니다.
>
> `반복 가능한(Iterable)` : 반복적으로 데이터를 가져올 수 있는 자료구조
>
> 이후 소개하는 자료구조는 모두 `Iterable` 합니다.

In [13]:
items = [1, 2, 3]
t_list = [4, 5]
items.extend(t_list)
print(items)

[1, 2, 3, 4, 5]


In [14]:
# 'id()' 함수는 변수의 고유 ID 값을 반환합니다.
items = [1, 2, 3]
t_list = [4, 5]
print(f'id(items) = {id(items)}')
# '+' 는 두 리스트를 합쳐서 새로운 리스트를 생성하는 것이므로
# 기존 리스트의 ID 값과 일치하지 않습니다.
items = items + t_list
print(f'id(result) = {id(items)}')

# 'extend()' 함수는 기존 리스트에 데이터를 추가하는 것이므로
# 기존 리스트의 ID 값이 변하지 않습니다.
items = [1, 2, 3]
t_list = [4, 5]
print(f'id(items) = {id(items)}')
items.extend(t_list)
print(f'id(items) = {id(items)}')

id(items) = 2683936306432
id(result) = 2683936295360
id(items) = 2683936360512
id(items) = 2683936360512


In [15]:
# 또한, '+'는 같은 리스트가 아니면 예외를 출력합니다.
items = [1, 2, 3]
t_set = {6, 7}
result = items + t_set
print(result)

TypeError: can only concatenate list (not "set") to list

In [16]:
# 'extend()' 함수는 'Iterable' 한 자료구조라면 모두 사용할 수 있습니다.
items = [1, 2, 3]

t_set = {6, 7}               # 집합(set)
t_dict = {'a': 11, 'b': 22}  # 사전(dict)
t_tuple = (111, 222, 333)    # 튜플(tuple)
t_range = range(3)           # 범위(range)
t_str = 'abcd'               # 문자열(str)

# 'for' 반복문의 사용법은 "7장 흐름 제어"에서 자세히 다룰 예정입니다.
for it in [t_set, t_dict, t_tuple, t_range, t_str]:
    items = [1, 2, 3]
    items.extend(it)
    print(items)

[1, 2, 3, 6, 7]
[1, 2, 3, 'a', 'b']
[1, 2, 3, 111, 222, 333]
[1, 2, 3, 0, 1, 2]
[1, 2, 3, 'a', 'b', 'c', 'd']


- `list.sort(L)` : 리스트 `L` 을 오름차순 정렬
- `list.sort(L, reverse=True)` : 리스트 `L` 을 내림차순 정렬

In [17]:
items = [3, 2, 9, 1, 5]
list.sort(items)
print(items)

# 문자열 데이터는 사전순으로 정렬
items = ['kiwi', 'apple', 'orange', 'banana', 'tomato', 'blueberry']
items.sort(reverse=True)
print(items)

# 숫자와 문자열 데이터가 섞여 있으면 어떻게 될까?  (주석을 풀고 돌려보세요!)
# items = [3, 9, 'orange', 8, 2, 'banana', 'tomato', 'blueberry', 12]
# items.sort()
# print(items)

[1, 2, 3, 5, 9]
['tomato', 'orange', 'kiwi', 'blueberry', 'banana', 'apple']


> 위와 비슷한 `sorted()` 내장 함수가 있습니다.
>
> 하지만, `sorted()` 함수는 정렬한 결과를 새로운 리스트로 생성합니다.
>
> 주로, 기존 리스트를 수정하지 않으면서 정렬된 리스트가 필요할 때 사용합니다.

In [18]:
items = [3, 2, 9, 1, 5]
print(f'items = {items}')
result = sorted(items)
print(f'result = {result}')
print(f'items = {items}')

items = [3, 2, 9, 1, 5]
result = [1, 2, 3, 5, 9]
items = [3, 2, 9, 1, 5]


> 멤버 연산자 `in`
>
> > 1. `A in ITEMS` : 자료구조 안에 특정 데이터가 포함되어 있는지 여부를 반환
> >
> > 2. `for IT in ITEMS` : 반복문 `for` 에서는 자료구조 안에 데이터를 한 개씩 반환 <br>
       ※ "7장 흐름 제어"에서 다룰 예정

In [19]:
items = [1, 2, 3, 4]
print(2 in items)

items = ['banana', 'apple', 'orange']
print('kiwi' in items)

True
False


> `문자열(str)` 은 "문자들을 순서대로 나열"한 것으로, 일종의 `리스트(list)` 입니다.
>
> 하지만, `문자열(str)` 은 수정이 불가능하다(Immutable)는 차이가 있습니다.

In [20]:
message = 'abcde'
print(f'message[2] = {message[2]}')
message[2] = 'T'
print(f'message[2] = {message[2]}')

message[2] = c


TypeError: 'str' object does not support item assignment

## 4. 리스트 연산

- 문자열과 마찬가지로 `+`, `*`, `len()` 을 이용한 연산이 가능

In [21]:
rgb = ['red', 'blue', 'green']
cmyk = ['cyan', 'magenta', 'yellow', 'white']

print(rgb + cmyk)
print(rgb * 2)
print(len(cmyk))

['red', 'blue', 'green', 'cyan', 'magenta', 'yellow', 'white']
['red', 'blue', 'green', 'red', 'blue', 'green']
4


- 숫자 데이터만 가지고 있는 경우, "4장 숫자 자료형 관련 함수" 에서 배운 `max()`, `min()`, `sum()` 등을 적용할 수 있음

In [22]:
costs = [100, -50, 1000, -70.5, 100.5]
print(sum(costs))
print(max(costs))
print(min(costs))

1080.0
1000
-70.5


- `list.index(L, D)` : 리스트 `L` 에서 데이터 `D` 를 찾아 처음으로 발견한 위치의 인덱스(index)를 반환
- 만약 해당 데이터를 못 찾을 경우, `ValueError` 예외가 발생함

In [23]:
items = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
print(items.index(3))

items.index(1111)


3


ValueError: 1111 is not in list

- `list.count(L, D)` : 리스트 `L` 에서 데이터 `D` 의 갯수를 반환

In [24]:
items = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
print(items.count(2))

print(items.count(1111))

2
0


---

## 별첨. 범위(range)

- `range(start, end, step)` : "\[시작, 끝)" 범위만큼 일정 간격(step)으로 데이터를 생성할 수 있는 방법
  - `정수(int)` 값만 가능
- `list(range())` 와 같이, 리스트 형태로 변환할 수 있음

In [25]:
r1 = range(10)  # [0, 10) 범위, 간격 1
print(r1)
print(list(r1))

range(0, 10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [26]:
r2 = range(5, 10)  # [5, 10) 범위, 간격 1
print(list(r2))

[5, 6, 7, 8, 9]


In [27]:
r3 = range(-5, 5, 2)  # [-5, 5) 범위, 간격 2
print(list(r3))

[-5, -3, -1, 1, 3]


In [28]:
r4 = range(3, -3, -1)  # 간격은 음수도 가능
print(list(r4))

[3, 2, 1, 0, -1, -2]
