# 파이썬 주요 데이터 구조
1. 리스트와 튜플

## 개요
- 리스트와 튜플 모두 여러 데이터를 담는 컨테이너형 변수임

In [4]:
# 리스트 정의 : [Data 1, Data 2, ..., Data n]
L1 = [1,2,3,4,5]
L2 = ['a', 'b', 'c', 1, 2]
L3 = [1, 2, [3, 4]]
print(L1, L2, L3)
print(type(L1))

[1, 2, 3, 4, 5] ['a', 'b', 'c', 1, 2] [1, 2, [3, 4]]
<class 'list'>


In [5]:
# 튜플의 정의: (Data 1, Data 2, ..., Data n)
T1 = (1,2,3,4,5)
T2 = ('a', 'b', 'c', 'd', 'e')
T3 = (1, 2, [3, 4])
print(T1, T2, T3)
print(type(T1))

(1, 2, 3, 4, 5) ('a', 'b', 'c', 'd', 'e') (1, 2, [3, 4])
<class 'tuple'>


## 공통점1: 인덱싱과 슬라이싱
- 리스트와 튜플 모두 인덱싱과 슬라이싱이 가능하다.
- 인덱싱 방법
    - List[i], Tuple[i]: 앞에서 i번째 요소 (0부터 시작)
    - List[-i], Tuple[-i]: 뒤에서 i번째 요소(-1부터 시작)
- 슬라이싱 방법 : `List[start:end:step]`, `Tuple[start:end:step]`
    - start 인덱스부터 end 인덱스까지 step으로 건너 뛴 부분 리스트 혹은 튜플을 반환
    - step은 default가 1로 입력하지 않아도 무방함, List[start:end]
    - start와 end도 입력하지 않아도 되나, 콜론(:)은 넣어야 함

In [8]:
# 예시
L = [4, 5, 1, 2, 10, 6]

print(L[2])
print(L[4])
print(L[-1])
print(L[0:3])
print(L[:3])
print(L[2:])
print(L[0:4:2])

1
10
6
[4, 5, 1]
[4, 5, 1]
[1, 2, 10, 6]
[4, 1]


## 공통점2: 순회 가능 (iterable)
- 리스트와 튜플 모두 for문을 이용하여 순회를 할 수 있음
    - `for data in List: `
    - `for data in Tuple: `
- 따라서 max, min 등의 순회 가능한 요소를 입력 받는 함수의 입력으로 사용할 수 있음

In [9]:
# for 문을 이용한 순회
L = [1,2,3,4,5]
T = (1,2,3,4,5)

print("List 순회")
for val in L:
    print(val ** 2)

print("\nTuple 순회")
for val in T:
    print(val ** 2)

List 순회
1
4
9
16
25

Tuple 순회
1
4
9
16
25


## 차이점1 : 가변과 불변
- 리스트의 요소는 바꿀 수 있으나, 튜플의 요소는 바꿀 수 없다.
- 따라서 리스트는 사전의 key로 사용할 수 없지만, 튜플은 사전의 key로 사용 가능하다.
    - Tip 1 : 불변의 자료형(int, float, str 등)만 사전의 key로 사용할 수 있다.
    - Tip 2 : 조건 등을 입력으로, 해당 조건에 대응되는 값들을 출력하는 사전 구축은 의외로 많은 데이터 전처리에서 사용한다.

In [10]:
# 리스트의 요소 변경
L = [1,2,3,4,5]
L[0] = 10
L

[10, 2, 3, 4, 5]

In [12]:
# 튜플의 요소 변경
# TypeError: 'tuple' object does not support item assignment --> 튜플의 요소는 변경할 수 없다
T = 1,2,3,4,5
T[0] = 10
T

TypeError: 'tuple' object does not support item assignment

## 차이점2 : 순회 속도
- 순회 속도는 리스트보다 튜플이 약간 더 빠름
- 따라서 요소를 변경할 필요가 없고, 요소에 대한 연산 결과만 필요한 경우에는 리스트보다 튜플이 적합하다.
    - 요소에 대한 연산 결과만 필요한 경우 : ndarray를 주로 사용한다.
- 데이터가 큰 경우에 한해서, 리스트로 작업한 후, 튜플로 자료형을 바꾼 후 순회를 함
    - 리스트 -> 튜플 : tuple(리스트)
    - 튜플 -> 리스트 : list(튜플)

In [13]:
# 순회 속도 비교하기
large_L = list(range(100000))
large_T = tuple(range(100000))

In [14]:
import time
time.time()

1645798252.919035

In [15]:
# 리스트 순회 속도 측정
import time
start_time = time.time()
for val1 in large_L:
    pass
end_time = time.time()
print(end_time - start_time)

0.0034728050231933594


In [16]:
# 튜플 순회 속도 측정
import time
start_time = time.time()
for val1 in large_T:
    pass
end_time = time.time()
print(end_time - start_time)

0.01259469985961914
