# 자료구조
> - 데이터의 집합  
> - 데이터가 들어가 있는 바구니  
> - 변수에 저장할 수 있는 데이터의 집합  
>> - **`list`**(리스트)  
>> - **`tuple`**(튜플)  
>> - **`dict`**(딕셔너리)  
>> - **`set`**(셋)

## 리스트(list)
> - 파이썬에서 가장 흔히 사용하는 데이터의 자료구조  
> - 순서가 있다.  
> - **`[ ]`** 대괄호로 묶어 사용한다.  
> - 리스트 안에 들어가는 요소들은 ,(쉼표)로 구분한다.

### 리스트의 생성

In [2]:
# 빈 리스트 만들기
# empty_list라는 변수명에 빈 리스트를 할당한다.
empty_list=[]
empty_list=list()
# 대괄호 뿐 아니라 명령어로도 작동한다.
empty_list

[]

In [19]:
# 값과 함께 리스트 만들기
# wallet 이라는 변수에 'coin', 'card', 'cash', 'id', 'licence' 5개의 텍스트 데이터가 들어가 있는 리스트를 저장
wallet=['coin', 'card', 'cash', 'id', 'licence']
wallet

['coin', 'card', 'cash', 'id', 'licence']

In [37]:
# 리스트 in 리스트
# 리스트 내부에는 정수, 실수, 문자열 뿐만 아니라 자료구조인 list와 앞으로 학습할 기타 자료구조도 포함시킬 수 있다.
test_list=[100,3.14,'안녕',wallet]
test_list

[100, 3.14, '안녕', ['coin', 'card', 'cash', 'id', 'licence']]

### 리스트 갯수세기

In [5]:
# 리스트 전체 항목의 갯수를 보고싶다면
# len() 명령어는 자료구조 내 원소의 갯수를 세는 명령어이다.
# python 기본 명령어로 다양한 자료구조에도 사용이 가능하다.
len(test_list)

4

### 리스트의 인덱싱(indexing), 슬라이싱(slicing)
> - 리스트의 특정 항목에 접근(색인)
> - 인덱싱은 하나의 값에 접근, 슬라이싱은 여러개의 값의 묶음에 접근  
> - 리스트의 순서를 인덱스라고 하며 **0**부터 시작

In [8]:
test_list=[10,20,30,40,50,60,70,80,90,100]
# 인덱싱
# 파이썬의 인덱스는 0 부터 시작한다.
# 리스트의 첫번째 항목 가져오기

test_list[-1]

100

In [13]:
# 슬라이싱
# 리스트의 첫번째 항목부터 3번째 항목까지 가져오기
test_list[0:3]
# 슬라이싱에 사용하는 :은 ~번째 항목까지 선택함을 의미한다.
# [시작인덱스:마지막인덱스+1]

[10, 20, 30]

In [15]:
# 슬라이싱 응용
# 리스트의 4번째 항목부터 마지막 항목까지 가져오기
test_list[3:]
# 리스트의 4번째 항목까지 가져오기
test_list[:4]

[10, 20, 30, 40]

In [None]:
# 리스트의 맨 마지막 항목 가져오기
# 인덱스로 음수를 전달하면 마지막 인덱스부터 역순으로 인덱싱을 한다.

In [18]:
# 리스트의 전체 항목 중 2의 배수 인덱스 항목가져오기
test_list[1::2] 
# [시작인덱스:마지막인덱스+1:step]

[20, 40, 60, 80, 100]

In [21]:
# test_list 호출
test_list

[100, 3.14, '안녕', ['coin', 'card', 'cash', 'id', 'licence']]

In [23]:
# 위의 test_list의 cash를 인덱싱 해보자
# 파이써닉한 코드 작업결과를 코드형태로 전달하고 추가 작업을 대상 코드 뒤에 이어붙이는 형태
test_list[3][2]

'cash'

### 리스트 편집

In [26]:
# 리스트 내 특정항목 업데이트
# 인덱스 혹은 슬라이싱으로 접근 한 데이터를 직접 변경하는 방법
test_list
test_list[0]=10
test_list

[10, 3.14, '안녕', ['coin', 'card', 'cash', 'id', 'licence']]

#### 내부명령어(메소드)
> 리스트는 자료구조를 갖고 있으면서 리스트 작업을 위해 필요한 내부명령어도 함께 제공한다.  
이후 자세히 다루지만 지금은 사용하는 방법 정도만을 기억해두시면 됩니다  
리스트이름 뒤 .(콤마)로 명령어에 접근이 가능합니다.  
- **`list_name`**.**`func()`**

In [38]:
# 리스트에 항목추가
# append() 명령어에 추가할 값을 전달하여 리스트에 추가합니다
a=[1,2,3]
test_list.append(a)
test_list

[100, 3.14, '안녕', ['coin', 'card', 'cash', 'id', 'licence'], [1, 2, 3]]

In [35]:
# 리스트에 특정 항목 삭제
test_list.remove(50)
test_list

ValueError: list.remove(x): x not in list

In [39]:
# 리스트의 맨 마지막 항목 꺼내오기 (값도 꺼내면서 리스트의 마지막 항목 삭제)
a=test_list.pop()
print(test_list,a)

[100, 3.14, '안녕', ['coin', 'card', 'cash', 'id', 'licence']] [1, 2, 3]


In [None]:
# 위에서 빼낸 맨 마지막 항목을 변수로 저장하여 사용 가능합니다.
# 경우에 따라서는 변수로 저장하지 않고 값을 제거 할 때도 유용하게 사용합니다.
a=test_list.pop()

In [72]:
# 테스트에 사용할 num_list 생성
num_list = [3, 4, 6, 1, 2, 8, 7]

# 리스트의 값 정렬 (숫자는 오름차순, 문자는 알파벳순, 한글은 가나다순)
# 역정렬도 가능
num_list.sort()
num_list

[1, 2, 3, 4, 6, 7, 8]

In [45]:
num_list[::-1]

[8, 7, 6, 4, 3, 2, 1]

In [43]:
# 리스트 순서 역순
num_list.sort(reverse=True)
num_list

num_list.reverse()
num_list

[1, 2, 3, 4, 6, 7, 8]

In [47]:
# 리스트 내 특정항목의 인덱스 가져오기
wallet.index('cash')
# 리스트 내 'cash'의 인덱스를 보여줌

2

In [48]:
wallet[2]

'cash'

In [53]:
# 리스트 내 특정항목 갯수 세기
# append로 coin 하나 추가한 값
test_list.append(100)
test_list

[100,
 3.14,
 '안녕',
 ['coin', 'card', 'cash', 'id', 'licence'],
 100,
 100,
 100,
 100]

In [54]:
test_list.count(100)

5

### 리스트 연산

In [56]:
# int형 데이터가 들어가 있는 num1, num2 리스트 생성
num1 = [1, 2, 3, 4, 5]
num2 = [4, 5, 6, 7, 8]

In [57]:
num1+num2

[1, 2, 3, 4, 5, 4, 5, 6, 7, 8]

In [58]:
a='안녕하세요'
a[0]

'안'

In [60]:
num_list

[1, 2, 3, 4, 6, 7, 8]

In [63]:
# 리스트 내부 항목 합, 최소값, 최대값
sum(num_list), max(num_list), min(num_list)
# 위에 사용한 sum, min, max 명령어는 파이썬 내장 명령어입니다.
# 이미 학습한 print, len 명령어와 같이 다른 자료구조에도 적용가능합니다.

(31, 8, 1)

In [64]:
# 리스트의 덧셈 연산
num_list+num_list

[1, 2, 3, 4, 6, 7, 8, 1, 2, 3, 4, 6, 7, 8]

In [66]:
# 리스트의 곱셈 연산
num_list*2

[1, 2, 3, 4, 6, 7, 8, 1, 2, 3, 4, 6, 7, 8]

In [67]:
# 조건연산자 테스트
4 in num_list

True

### 리스트 삭제

In [71]:
# 리스트 삭제 (변수 삭제, 값 삭제)
# 생성한 리스트는 남아있지만 내부 항목을 모두 삭제합니다.
test_list.clear()
test_list

NameError: name 'test_list' is not defined

In [None]:
# 메모리에서 완전히 삭제
del test_list
test_list

## 딕셔너리(dict)
> 사전을 떠올려봅시다. 사전을 구성하고 있는 항목은?    
> - 단어 : 단어의 설명  

> `key`와 `value`값을 쌍으로 저장가능 한 자료구조  
> - `key` : `value`  
> - **`{ }`** 중괄호로 묶어 사용한다.  
> - 딕셔너리 요소 구분은 리스트와 마찬가지로 쉼표  

### 딕셔너리 생성

In [74]:
# 빈 딕셔너리 생성
test_dict={}
# 딕셔너리는 중괄호 사용
test_dict

{}

In [3]:
# 값을 추가하면서 딕셔너리 생성
wallet = {
    'card':'SK카드',
    'cash':75000,
    'coin':{'500원':1,
            '100원':1,},
    'id':['주민등록증', '여권'],
    'licence':'운전면허증'
}

# 중괄호 내 key : value 값을 전달하고 각 항목의 구분은 쉼표
# 리스트와 마찬가지로 딕셔너리 내부에 리스트등 타 자료구조 저장 가능

In [77]:
# 딕셔너리 호출
wallet

{'card': 'SK카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증'}

In [80]:
# 소지품 중 아무거나 하나 선정 

bag = {'kardigun':1,'tumbler':'starbucks tumbler','notebook':1}
bag

{'kardigun': 1, 'tumbler': 'starbucks tumbler', 'notebook': 1}

### 딕셔너리 갯수세기

In [81]:
len(wallet)

5

### 딕셔너리 값에 접근하기

In [83]:
# key값으로 딕셔너리 값에 접근
wallet['card']
# 리스트에서 인덱스를 사용하였다면 딕셔너리는 key값을 전달하여 값에 접근합니다.

'SK카드'

### 딕셔너리 편집

In [102]:
# 딕셔너리에 point card key를 갖는 해피포인트 문자열을 값으로 저장
wallet['card']='삼성카드'
# key값이 숫자여도 관계없음

wallet

{'card': '삼성카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증'}

In [103]:
# 딕셔너리 특정 항목 업데이트
wallet['point card']='해피포인트'
wallet

{'card': '삼성카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증',
 'point card': '해피포인트'}

In [7]:
# 딕셔너리 특정 value값 빼오기


In [105]:
# pop 명령어로 빼온 값, wallet에는 해당항목 사라져 있음
a=wallet.pop('point card')
wallet

{'card': '삼성카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1, '50원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증'}

In [90]:
a

'해피포인트'

In [106]:
# 딕셔너리 내부 속성 값에 접근해서 값 업데이트도 가능하다.
# wallet의 coin key값을 갖는 값에 50원:1 값을 추가한다.
# 파이써닉한 코드
wallet['coin']['50원']=1
wallet

{'card': '삼성카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1, '50원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증'}

In [4]:
# wallet 딕셔너리의 card 항목을 카카오체크카드로 업데이트
wallet['card']="카카오체크카드"
wallet

{'card': '카카오체크카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1},
 'id': ['주민등록증', '여권'],
 'licence': '운전면허증'}

In [107]:
# wallet id key값에 '운전면허증' 추가
wallet['id'].append('운전면허증')
wallet

{'card': '삼성카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1, '50원': 1},
 'id': ['주민등록증', '여권', '운전면허증'],
 'licence': '운전면허증'}

### 딕셔너리 삭제

In [108]:
# 딕셔너리 항목 제거
# 딕셔너리의 key값까지 전달하여 해당 key값과 값을 동시에 제거
del wallet['licence']
wallet

{'card': '삼성카드',
 'cash': 75000,
 'coin': {'500원': 1, '100원': 1, '50원': 1},
 'id': ['주민등록증', '여권', '운전면허증']}

In [113]:
# 딕셔너리 원소 전체 삭제
wallet.clear()
wallet

{}

In [115]:
# 딕셔너리 변수 완전 삭제
del wallet
wallet

NameError: name 'wallet' is not defined

### 딕셔너리 추가 명령어

In [109]:
# 딕셔너리 내 키 값을 확인
wallet.keys()

dict_keys(['card', 'cash', 'coin', 'id'])

In [110]:
# 딕셔너리 내 값을 확인
wallet.values()

dict_values(['삼성카드', 75000, {'500원': 1, '100원': 1, '50원': 1}, ['주민등록증', '여권', '운전면허증']])

In [111]:
# 딕셔너리의 key, value 쌍을 확인
wallet.items()

dict_items([('card', '삼성카드'), ('cash', 75000), ('coin', {'500원': 1, '100원': 1, '50원': 1}), ('id', ['주민등록증', '여권', '운전면허증'])])

## String
> - 자료구조와 같이 시퀀스를 가지고 있음.  
> - 인덱싱, 슬라이싱이 가능.
> - 문자열의 처리를 위한 다양한 함수가 구비.
> - string 타입 데이터에 대한 여러가지 함수를 학습해 보겠습니다.

In [116]:
## 테스트 문자열
text = '''
The Python interpreter and the extensive
standard library are freely available in source or binary form
for all major platforms from the Python Web site
and may be freely distributed. The same site also contains distributions
of and pointers to many free third party Python modules, programs and tools
, and additional documentation.'
'''

text

"\nThe Python interpreter and the extensive\nstandard library are freely available in source or binary form\nfor all major platforms from the Python Web site\nand may be freely distributed. The same site also contains distributions\nof and pointers to many free third party Python modules, programs and tools\n, and additional documentation.'\n"

### 문자열 인덱싱 및 슬라이싱

In [119]:
# 인덱싱 및 슬라이싱 테스트
text[10:40]

'n interpreter and the extensiv'

In [120]:
# 문자열 출력
print(text)


The Python interpreter and the extensive
standard library are freely available in source or binary form
for all major platforms from the Python Web site
and may be freely distributed. The same site also contains distributions
of and pointers to many free third party Python modules, programs and tools
, and additional documentation.'



## 문자열 내장함수
문자열 처리를 위해 자주 사용하는 함수들을 정리 해두었습니다. 위의 테스트 문자열에 하나하나 적용해가면서 사용법을 익혀봅시다.  

**`upper()`** : 대문자 변환  

**`lower()`** : 소문자 변환  

**`capitalize()`** : 문장 첫단어 대문자 변환  

**`join()`** : 문자열 이어 붙이기  

**`split()`** : 문자열 나누기  

**`strip()`** : 공백 제거  

**`replace()`** : 치환  

**`startswith()`** : ~로 시작하는 단어찾기  

**`endswith()`** : ~로 끝나는 단어찾기  

In [125]:
# 문장단위 구분
text.split(". ")

"The same site also contains distributions\nof and pointers to many free third party Python modules, programs and tools\n, and additional documentation.'\n"

In [127]:
# 문장 인덱싱
text.split(". ")[0]

'\nThe Python interpreter and the extensive\nstandard library are freely available in source or binary form\nfor all major platforms from the Python Web site\nand may be freely distributed'

In [130]:
# 단어단위로 문장을 쪼개면?
text.split(' ')

['\nThe',
 'Python',
 'interpreter',
 'and',
 'the',
 'extensive\nstandard',
 'library',
 'are',
 'freely',
 'available',
 'in',
 'source',
 'or',
 'binary',
 'form\nfor',
 'all',
 'major',
 'platforms',
 'from',
 'the',
 'Python',
 'Web',
 'site\nand',
 'may',
 'be',
 'freely',
 'distributed.',
 'The',
 'same',
 'site',
 'also',
 'contains',
 'distributions\nof',
 'and',
 'pointers',
 'to',
 'many',
 'free',
 'third',
 'party',
 'Python',
 'modules,',
 'programs',
 'and',
 'tools\n,',
 'and',
 'additional',
 "documentation.'\n"]

In [134]:
# 대소문자 변환 및 첫단어 대문자 변환
text.split(' ')[1].capitalize()
# 대문자 변환
text.split(' ')[1].upper()
text.split(' ')[1].lower()

'python'

In [137]:
# 공백 생성 (\n, \t)
# \n <--- 엔터
# \t <--- 탭
text.split(' ')[1]+'\n'+text.split(' ')[1]
print(text.split(' ')[1]+'\t'+text.split(' ')[1])

Python	Python


In [139]:
# 공백 제거
# strip 문자열 앞 뒤 공백을 다 지워줍니다.
print(text.strip())

The Python interpreter and the extensive
standard library are freely available in source or binary form
for all major platforms from the Python Web site
and may be freely distributed. The same site also contains distributions
of and pointers to many free third party Python modules, programs and tools
, and additional documentation.'


In [141]:
# 단어 변환(치환) replace
print(text.replace('Python','Java'))


The Java interpreter and the extensive
standard library are freely available in source or binary form
for all major platforms from the Java Web site
and may be freely distributed. The same site also contains distributions
of and pointers to many free third party Java modules, programs and tools
, and additional documentation.'



## 튜플(tuple)
> - 데이터가 고정이 되어 변경이 불가능 한 데이터 집합  
> - 연산이나 입력값을 전달하는 자료구조로는 잘 사용하지 않고 결과값을 출력하는 경우 많이 사용한다.  
> - **`( )`** 소괄호로 묶어 사용한다.  
> - 구분은 , 콤마로 사용한다.  

### 튜플 생성

In [142]:
test_tuple2 = (1, 2, 3, 4)
test_tuple3 = 5, 6

In [143]:
test_tuple2

(1, 2, 3, 4)

### 튜플 인덱싱

In [144]:
# 튜플 인덱싱 테스트
test_tuple2[3]

4

### 튜플 편집
한번 튜플에 들어간 값은 변경이 불가능하다. 다만 값 추가는 가능하다

In [145]:
# 튜플 업데이트 테스트
test_tuple2[0]=10

TypeError: 'tuple' object does not support item assignment

In [None]:
# 튜플에 값을 추가할 때도 튜플형태의 전달만 유효하다


### 튜플 삭제
튜플 전체삭제는 가능하지만 값 삭제는 불가능하다.

In [146]:
# 튜플 삭제 테스트
del test_tuple2[0]


TypeError: 'tuple' object doesn't support item deletion

### 언팩

In [147]:
# 값을 변경하지 못하기 때문에 값을 분리시킬 수 있음
a, b=test_tuple3
print(a,b)

5 6


## 셋(set), 집합
> - 중복된 값을 허용하지 않는 자료구조
> - 데이터셋의 고유값을 확인하는 용도로도 사용(중복제거)  
> - **`{ }`** 대괄호로 묶어 사용한다.
> - **집합 연산**을 지원한다.

### 셋 생성

In [149]:
# 셋 생성 테스트
empty_set = {}
test_set1 = {1, 2, 3, 4}
test_set2 = {3, 4, 5, 6}

### 셋 편집

In [155]:
# 셋에 값 하나 추가
# 중복을 허용하지 않기 때문에 셋에 같은 값이 있을 경우 추가하지 않음

test_set1.add(6)
test_set1

{1, 2, 3, 4, 6}

In [None]:
# 셋에 값 여러개 추가


In [None]:
# 셋 값 하나삭제

# test_set.discard(5)

### 셋 집합 연산

In [156]:
# 교집합
test_set1 = {1, 2, 3, 4}
test_set2 = {3, 4, 5, 6}
test_set1.intersection(test_set2)

{3, 4}

In [157]:
# 합집합
test_set1.union(test_set2)

{1, 2, 3, 4, 5, 6}

In [158]:
# 차집합
test_set1.difference(test_set2)

{1, 2}

In [159]:
test_list1=[12,13,41,52,63]
test_list2=[1,2,3,4,41,52]

In [163]:
set(test_list1).intersection(set(test_list2))

{41, 52}

### 셋 삭제

In [None]:
# 셋 삭제 테스트
