# 자료구조
> - 데이터의 집합  
- 데이터가 들어가 있는 바구니  
- 변수에 저장할 수 있는 데이터의 집합  
>> - **`list`**(리스트)  
>> - **`tuple`**(튜플)  
>> - **`dict`**(딕셔너리)  
>> - **`set`**(셋)

## 리스트(list)
> - 파이썬에서 가장 흔히 사용하는 데이터의 자료구조  
- 순서가 있다.  
- **`[ ]`** 대괄호로 묶어 사용한다.  
- 리스트 안에 들어가는 요소들은 ,(쉼표)로 구분한다.

### 리스트의 생성

In [5]:
# 빈 리스트 만들기
# 용어 정리 : 변수에 데이터를 저장하는 작업을 저장, 할당, 디파인, 바인딩
empty_list = list()
# 대괄호 뿐 아니라 명령어로도 작동한다.
empty_list2 = []
print(empty_list)
print(empty_list2)

[]
[]


In [74]:
# 값과 함께 리스트 만들기
# wallet 이라는 변수에 'coin', 'card', 'cash', 'id', 'licence' 5개의 텍스트 데이터가 들어가 있는 리스트를 저장
wallet = ['coin', 'card', 'cash', 'id', 'licence']
wallet

['coin', 'card', 'cash', 'id', 'licence']

In [89]:
# 리스트 in 리스트
# 리스트 내부에는 정수, 실수, 문자열 뿐만 아니라 자료구조인 list와 앞으로 학습할 기타 자료구조도 포함시킬 수 있다.
wallet2=[1,3.14,wallet]
wallet2

[1, 3.14, ['coin', 'card', 'cash', 'id', 'licence']]

### 리스트 갯수세기

In [11]:
# 리스트 전체 항목의 갯수를 보고싶다면
# len() 명령어는 자료구조 내 원소의 갯수를 세는 명령어이다.
# python 기본 명령어로 다양한 자료구조에도 사용이 가능하다.
len(wallet)

5

### 리스트의 인덱싱(indexing), 슬라이싱(slicing)
> - 리스트의 특정 항목에 접근(색인)
- 인덱싱은 하나의 값에 접근, 슬라이싱은 여러개의 값의 묶음에 접근  
- 리스트의 순서를 인덱스라고 하며 **0**부터 시작

In [14]:
# 인덱싱
# 파이썬의 인덱스는 0 부터 시작한다.
# 리스트의 첫번째 항목 가져오기
wallet[0]

'licence'

In [18]:
# 슬라이싱
# [start index : end index+1 : steps]

# 리스트의 첫번째 항목부터 3번째 항목까지 가져오기
wallet[0:3]
wallet[:3]
wallet[-5:-2]

# 리스트의 4번째 항목부터 마지막 항목까지 가져오기
wallet[3:]
wallet[-2:]
# 리스트의 4번째 항목까지 가져오기
wallet[:4]
wallet[0:4]

# 리스트의 맨 마지막 항목 가져오기
# 인덱스로 음수를 전달하면 마지막 인덱스부터 역순으로 인덱싱을 한다.
wallet[4]
wallet[-1]

# 리스트의 전체 항목 중 2의 배수 인덱스 항목가져오기
test_list = [1,2,3,4,5,6,7,8,9,10]
test_list[1::2]

['coin', 'card', 'cash']

In [50]:
# 위의 wallet2의 cash를 인덱싱 해보자
wallet2
wallet2[2][2]

'cash'

### 리스트 편집

In [None]:
# 리스트 내 특정항목 업데이트
# 인덱스 혹은 슬라이싱으로 접근 한 데이터를 직접 변경하는 방법


#### 내부명령어
> 리스트는 자료구조를 갖고 있으면서 리스트 작업을 위해 필요한 내부명령어도 함께 제공한다.  
이후 자세히 다루지만 지금은 사용하는 방법 정도만을 기억해두시면 됩니다  
리스트이름 뒤 .(콤마)로 명령어에 접근이 가능합니다.  
- **`list_name`**.**`func()`**

In [83]:
# 리스트에 항목추가
# append() 명령어에 추가할 값을 전달하여 리스트에 추가합니다.
wallet2.append(500)

#extend
# wallet2.extend(wallet)
# wallet2

In [77]:
# 리스트에 특정 항목 삭제
wallet2.remove(500)

In [91]:
# 리스트의 맨 마지막 항목 꺼내오기 (값도 꺼내면서 리스트의 마지막 항목 삭제)
wallet2.append(100)
pop_val = wallet2.pop()
wallet2
pop_val
# 위에서 빼낸 맨 마지막 항목을 변수로 저장하여 사용 가능합니다.
# 경우에 따라서는 변수로 저장하지 않고 값을 제거 할 때도 유용하게 사용합니다.

100

In [97]:
# 테스트에 사용할 num_list 생성
num_list = [3, 4, 6, 1, 2, 8, 7]

# 리스트의 값 정렬 (숫자는 오름차순, 문자는 알파벳순, 한글은 가나다순)
num_list.sort()
# 역정렬도 가능
num_list.sort(reverse=True)
num_list

[8, 7, 6, 4, 3, 2, 1]

In [115]:
# 리스트 순서 역순(단순 역순)
num_list = [3, 4, 6, 1, 2, 8, 7]
num_list.reverse()
num_list

[7, 8, 2, 1, 6, 4, 3]

In [116]:
num_list = [3, 4, 6, 1, 2, 8, 7]
# 리스트 내 6의 인덱스 위치번호를 보여줌
num_list.index(6)
# 리스트에 6이라는 값이 들어있는 인덱스 번호를 넣어서 그 값을 찾고 100으로 변환
num_list[num_list.index(6)] =100
num_list

[7, 8, 2, 1, 100, 4, 3]

In [113]:
num_list

[7, 8, 2, 1, 100, 4, 3]

In [117]:
# 리스트 내 특정항목 갯수 세기
# append로 coin 하나 추가한 값
wallet.count('card')

1

### 리스트 연산

In [130]:
# int형 데이터가 들어가 있는 num1, num2 리스트 생성
num1 = [1, 2, 3, 4, 5]
num2 = [4, 5, 6, 7, 8]

In [132]:
# 리스트의 덧셈 연산
num1+num2
# 리스트 내부 항목 합, 최소값, 최대값
sum(num2), min(num2), max(num2)
# 이미 학습한 print, len 명령어와 같이 다른 자료구조에도 적용가능합니다.

# 조건연산자 테스트
1 not in num1

# 리스트의 곱셈 연산
num1[0]*num2[1]

5

### 리스트 삭제

In [127]:
# 리스트 삭제 (변수 삭제, 값 삭제)
# 생성한 리스트는 남아있지만 내부 항목을 모두 삭제합니다.
wallet.clear()
wallet

# 메모리에서 완전히 삭제
del wallet
wallet

## 딕셔너리(dict)
> `key`와 `value`값을 쌍으로 저장가능 한 자료구조  
- `key` : `value`  
- **`{ }`** 중괄호로 묶어 사용한다.  
- 딕셔너리 요소 구분은 리스트와 마찬가지로 쉼표  
- indexing이 되지 않음

### 딕셔너리 생성

In [133]:
# 빈 딕셔너리 생성
test_dict = {}
# 딕셔너리는 중괄호 사용
test_dict = dict()

In [202]:
# 값을 추가하면서 딕셔너리 생성
wallet = {
    'card':'SK카드',   
    'cash':3000,
    'coin':{'500원': 2, '100원' : 3},  #딕셔너리 내 딕셔너리
    'id':['주민등록증','여권'],   #딕셔너리 내 list
    'licence':'운전면허증'
}

# 중괄호 내 key : value 값을 전달하고 각 항목의 구분은 쉼표
# 리스트와 마찬가지로 딕셔너리 내부에 리스트등 타 자료구조 저장 가능

In [168]:
# 딕셔너리 호출
wallet

{'card': 'SK카드',
 'cash': 3000,
 'coin': {'500원': 2, '100원': 3},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증'}

### 딕셔너리 갯수세기

In [169]:
len(wallet)

5

### 딕셔너리 값에 접근하기

In [170]:
# key값으로 딕셔너리 값에 접근
wallet['card']
# 리스트에서 인덱스를 사용하였다면 딕셔너리는 key값을 전달하여 값에 접근합니다.
# wallet 100원짜리 값에 접근
wallet['coin']['100원']
# '여권'
wallet['id'][1]

'SK카드'

### 딕셔너리 편집

In [180]:
# 딕셔너리에 point card key를 갖는 해피포인트 문자열을 값으로 저장
wallet['point card'] = '해피포인트'
wallet
# key값이 숫자여도 관계없음(인덱싱이랑 헷갈릴 수 있음)
# wallet[100] = 100
# wallet

{'card': 'SK카드',
 'cash': 3000,
 'coin': {'500원': 2, '100원': 3},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증',
 'point card': '해피포인트',
 100: 100}

In [181]:
# 딕셔너리 특정 항목 업데이트
wallet.update({'point card': 'CJ one'})  # 위에처럼 새로 지정해주는게 더 편하긴 함
wallet

{'card': 'SK카드',
 'cash': 3000,
 'coin': {'500원': 2, '100원': 3},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증',
 'point card': 'CJ one',
 100: 100}

In [182]:
# 딕셔너리 특정 value값 빼오기, value를 지정해줘야함
# pop 명령어로 빼온 값, wallet에는 해당항목 사라져 있음
wallet.pop(100)
wallet

{'card': 'SK카드',
 'cash': 3000,
 'coin': {'500원': 2, '100원': 3},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증',
 'point card': 'CJ one'}

In [200]:
# 딕셔너리 내부 속성 값에 접근해서 값 업데이트도 가능하다.
# wallet의 coin key값을 갖는 값에 50원:1 값을 추가한다.
wallet['coin']['50원'] = 1   # 또는 wallet['coin'].update({'50원': 1})
wallet

{'card': 'SK카드',
 'cash': 3000,
 'coin': {'500원': 2, '100원': 3, '50원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증',
 'point card': 'CJ one'}

In [211]:
# wallet id key값에 '운전면허증' 추가
wallet['id'].append('운전면허증')
wallet

{'card': 'SK카드',
 'cash': 3000,
 'coin': {'500원': 2, '100원': 3},
 'id': ['주민등록증', '여권', '운전면허증'],
 'licence': '운전면허증'}

### 딕셔너리 삭제

In [228]:
# 딕셔너리 항목 제거
# 딕셔너리의 key값까지 전달하여 해당 key값과 값을 동시에 제거
del wallet['id']

{}

In [None]:
# 딕셔너리 원소 전체 삭제
wallet.clear()
wallet

In [230]:
# 딕셔너리 변수 완전 삭제
del wallet

NameError: name 'wallet' is not defined

### 딕셔너리 추가 명령어

In [214]:
# 딕셔너리 내 키 값을 확인
wallet.keys()
# 딕셔너리 내 값을 확인
wallet.values()
wallet['coin'].keys()
# 딕셔너리의 key, value 쌍을 확인
wallet.items()

dict_keys(['card', 'cash', 'coin', 'id', 'licence'])

## 튜플(tuple)
> - 데이터가 고정이 되어 변경이 불가능 한 데이터 집합  
- 연산이나 입력값을 전달하는 자료구조로는 잘 사용하지 않고 결과값을 출력하는 경우 많이 사용한다.  
- **`( )`** 소괄호로 묶어 사용한다.  
- 구분은 , 콤마로 사용한다.  

### 튜플 생성

In [244]:
test_tuple = () # 의미가 모호해서 잘 사용하지 않는다.
test_tuple1 = tuple()
test_tuple2 = (1, 2, 3, 4)
test_tuple3 = 5, 6

### 튜플 인덱싱

In [234]:
# 튜플 인덱싱 테스트
test_tuple3
test_tuple2[1]

2

### 튜플 편집
한번 튜플에 들어간 값은 변경이 불가능하다. 다만 값 추가는 가능하다

In [237]:
# 튜플 업데이트 테스트
test_tuple2[1] = 2  # 값이 변경되지 않음(튜플 특징)

TypeError: 'tuple' object does not support item assignment

### 튜플 삭제
튜플 전체삭제는 가능하지만 값 삭제는 불가능하다.

In [243]:
# 튜플 삭제 테스트
del test_tuple3

### 언팩 (리스트, 문자열도 가능)

In [256]:
# 값을 변경하지 못하기 때문에 값을 분리시킬 수 있음 
a,b,c,d, = test_tuple2
print(a,b,c,d)

1 2 3 4


## 셋(set), 집합
> - 중복된 값을 허용하지 않는 자료구조
- 데이터셋의 고유값을 확인하는 용도로도 사용(중복제거)  
- **`{ }`** 대괄호로 묶어 사용한다.
- **집합 연산**을 지원한다.

### 셋 생성

In [258]:
# 셋 생성 테스트
empty_set = {}
empty_set = set()
test_set1 = {1, 2, 3, 4}
test_set2 = {3, 4, 5, 6}

### 셋 편집

In [266]:
# 셋에 값 하나 추가
# 중복을 허용하지 않기 때문에 셋에 같은 값이 있을 경우 추가하지 않음
test_set1.add(5)
test_set1

{1, 2, 3, 4, 5, 6, 7}

In [272]:
# 셋에 값 여러개 추가
test_set1.update({5,6,7})
test_set1

{1, 2, 3, 4, 5, 6, 7}

In [274]:
# 셋 값 하나삭제
test_set1.discard(5)
test_set1

{1, 2, 3, 4, 6, 7}

### 셋 집합 연산

In [281]:
# 교집합
# test_set1 and test_set2
test_set1.intersection(test_set2)

# 합집합
# test_set1 or test_set2
test_set1.union(test_set2)

# 차집합a
# test_set1 - test_set2
test_set1.difference(test_set2)

{1, 2, 7}

### 셋 삭제

In [282]:
# 셋 삭제 테스트
del test_set1
test_set1

NameError: name 'test_set1' is not defined