# 자료구조란

- 여러 개의 값들을 모아서 관리하는 데이터 타입.
    - 한 개의 변수는 한 개의 값 밖에는 가지지 못한다. 그러나 하나의 변수로 여러 개의 값 묶어서 저장해 관리해야 할 경우가 있다. 
    - 예) 고객의 정보의 경우 이름, 나이, 주소, 전화번호 등 여러개의 값이 모여서 하나의 값이 된다. 
- 파이썬은 데이터를 모으는 방식에 따라 다음과 같이 4개의 타입을 제공한다.
    - List: 순서가 있으며 중복된 값들을 모으는 것을 허용하고 구성하는 값들(원소)을 변경할 수 있다.
    - Tuple: 순서가 있으며 중복된 값들을 모으는 것을 허용하는데 구성하는 값들을 변경할 수 없다.
    - Dictionary: key-value 형태로 값들을 저장해 관리한다. (key: 인덱스 역할을 하는 것을 직접 지정함, 중복이 안됨, 키 값만 다르면 중복된 값 허용)
    - Set: 중복을 허용하지 않고 값들의 순서가 없다.
- 원소, 성분, 요소, element
    - 자료구조의 값들을 구성하는 개별 값들을 말한다.
    - len(자료구조) 함수
        - 자료구조 내의 원소의 개수를 반환한다.

|자료구조| 순서가 있는가?<br>(ordered) | 중복된 값을 허용하나?<br>(mutable) | 수정이 가능한가?<br>(changeable)|식별자 유무<br>(indexing)|구문|특징|
|----|----|----|----|----|----|----|
|List|O|O|O|O|[값, 값, 값]||
|Tuple|O|O|X|O|1. (값, 값, 값)<br>2. 값, 값, 값|함수에 넣을 때는 반드시 괄호 튜플 사용<br>원소가 1개 일때는 마지막에 쉼표 붙여주기|
|Dictionary|X|key:X, value:O|O|O|1. {키 : 값, 키 : 값, 키 : 값}<br>2. dict(key=value, key=value)|key값은 불변(Immutable)의 값들만 사용 가능|
|Set|X|X|O|X|{값, 값, 값}|{}(빈 중괄호는 dictionary)

# List (리스트)

- 값을 순서대로 모아서 관리하는 자료구조. 원소(element)들을 순번을 이용해 식별한다.
    - 각각의 원소가 어떤 값인지를 순번을 가지고 식별하기 때문에 순서가 매우 중요하다. 즉 같은 값에 대해 순서가 바뀌면 안된다.
- 각 원소들은 순번을 index라고 하며 값을 조회하거나 변경할 때 index를 이용해 식별한다.
    - index는 문자열과 마찮가지로 양수 index와 음수 index 두개가 각 값에 생긴다.
    - 양수 index는 앞에서부터 음수 index는 뒤에서 부터 값을 식별할 때 사용하는 것이 편리하다.
- 중복된 값들을 저장할 수 있다.
- 각 원소들의 데이터 타입은 달라도 상관없다. (문법적으로는 상관 없음)
    - 보통은 같은 타입의 데이터를 모은다.
- 리스트를 구성하는 원소들을 변경할 수 있다. (추가, 삭제, 변경이 가능)

## List 생성 구문
```python
[값, 값, 값, ..]
```

In [1]:
l1 = [10, 20, 30, 40, 50]             
print(l1)

[10, 20, 30, 40, 50]


In [2]:
# type(값): 값의 데이터 타입 반환
type(30), type(3.2), type(True), type("abc")

(int, float, bool, str)

In [3]:
type(l1)

list

In [4]:
print(type(l1))

<class 'list'>


In [5]:
l2 = [100, 4.5, True, "abcd"]
l2

[100, 4.5, True, 'abcd']

In [7]:
l3 = [100, [1, 2, 3]] # 리스트(자료구조)도 값
l3

[100, [1, 2, 3]]

## Indexing과 Slicing을 이용한 원소(element) 조회 및 변경

### Indexing
- 하나의 원소를 조회하거나 변경할 때 사용
- 리스트\[index\] 
    - index의 원소를 조회
- 리스트\[index\] = 값
    - index의 원소를 변경 (문자열과 다른 부분)

### Slicing
- 범위로 조회하거나 그 범위의 값들을 변경한다.
- 기본구문: **리스트\[ 시작 index : 종료 index : 간격\]**
    - 시작 index ~ (종료 index – 1)
    - 간격을 지정하면 간격만큼 index를 증/감한다. (생략 시 1이 기본 간격)
- **0번 index 부터 조회 할 경우 시작 index는 생략가능**
    - 리스트 \[ : 5\] => 0 ~ 4 까지 조회
- **마지막 index까지 (끝까지) 조회 할 경우 종료 index는 생략 가능**
    - 리스트\[2 : \] => 2번 index 에서 끝까지
- **명시적으로 간격을 줄 경우**
    - 리스트\[ : : 3 \] => 0, 3, 6, 9.. index의 값 조회
    - 리스트\[1 : 9 : 2\] => 1, 3, 5, 7 index의 값 조회
- **시작 index > 종료 index, 간격을 음수로 하면 역으로 반환한다.(Reverse)**
    - 리스트\[5: 1: -1\] => 5, 4, 3, 2 index의 값 조회
    - 리스트\[: : -1\]  => 마지막 index ~ 0번 index 까지 의미. Reverse 한다.

#### slicing을 이용한 값 변경 (문자열과 다른 부분)
- slicing 을 이용할 경우 slicing된 원소 개수와 동일한 개수의 값들을 대입한다.
    - `리스트[1:5] = 10,20,30,40` : index 1, 2, 3, 4의 값을 20으로 변경

In [6]:
l = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
# indexing - 한 개 값을 조회
print(l[2]) # 앞에서 3번째 값
print(l[-3]) # 뒤에서 3번째 값

2
7


In [7]:
# 변경
print(l)
l[1] = 100
print(l)
l[-2] = 800
print(l)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 100, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 100, 2, 3, 4, 5, 6, 7, 800, 9]


In [11]:
# slicing: 범위로 여러개의 원소 조회
l[2:7:2]

[2, 4, 6]

In [12]:
l[2:7]

[2, 3, 4, 5, 6]

In [13]:
l[:7] # 0 ~ 7-1, 1씩 증가

[0, 100, 2, 3, 4, 5, 6]

In [14]:
l[4:] # 4 ~ 끝, 1씩 증가

[4, 5, 6, 7, 800, 9]

In [15]:
l[4::3] # 4 ~ 끝, 3씩 증가

[4, 7]

In [16]:
print(l)
print(l[8:2:-1]) # 8 ~ 2-(-1)

[0, 100, 2, 3, 4, 5, 6, 7, 800, 9]
[800, 7, 6, 5, 4, 3]


In [17]:
l[::-1] # 전체 reverse

[9, 800, 7, 6, 5, 4, 3, 2, 100, 0]

## List 연산자
- 리스트 + 리스트
    - 두 리스트의 원소들을 합친 리스트를 반환한다.  ex) [1,2] + [3,4] -> [1,2,3,4]
- 리스트 * 정수
    - 같은 리스트의 원소들을 정수번 합친 리스트를 반환한다.   ex) [1,2] * 3 -> [1,2,1,2,1,2]
- in, not in 연산자
    - 값 in 리스트
        - 리스트의 원소로 값이 **있으면** True, 없으면 False 반환
    - 값 not in 리스트
        - 리스트의 원소로 값이 **없으면** True, 있으면 False 반환  
- len(리스트)
    - 리스트 내의 원소수를 반환.        

In [19]:
a = [1, 2, 3]
b = [10, 20, 30]
c = a + b
print(c)

[1, 2, 3, 10, 20, 30]


In [22]:
print(a)
d = a * 5  # a + a + a + a + a
print(d)

[1, 2, 3]
[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]


In [26]:
print(10 in c)  # 10이 리스트 c의 원소로 있는지 여부
print(100 in c)

True
False


In [27]:
print(10 not in c) # 10이 리스트 c의 원소로 없는지 여부
print(100 not in c)

False
True


In [29]:
print([1, 2] in c) # [1, 2]가 리스트 c의 원소로 있는지 여부
c = [[1, 2], 3, 4]
print([1, 2] in c)

False
True


In [32]:
print(3 in c and 4 in c)  # c안에 3, 4 둘다 있는지 여부
print(3 in c or 100 in c) # c안에 3 또는 둘중 하나가 있는지 여부

True
True


In [35]:
print([2, 1] in c) # 순서가 달라서 False가 나옴

False


In [37]:
c

[[1, 2], 3, 4]

In [38]:
c[1], c[2]

(3, 4)

## 중첩 리스트 (Nested List)
- List가 원소로 List를 가지는 것을 말한다.
    - List를 포함한 모든 자료구조 타입들도 다 값이므로 다른 자료구조의 원소로 들어갈 수 있다.    

In [40]:
l = [
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
]
print(l)

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]


In [41]:
len(l)

3

In [44]:
print(l[0])
print(l[0][1])
print(l[2][2])

[1, 2, 3]
2
9


## List 대입
리스트의 원소들을 각각 다른 변수에 대입하는 표현식

In [46]:
l = [1, 2, 3]  # 처리 결과가 여러개일 경우에 변수를 선언하기 위해 사용
num1, num2, num3 = l
print(num1, num2, num3, sep=', ')

1, 2, 3


In [51]:
a, b, c = [100, 200, 300]  # 굳이 괄호를 할 필요가 없기 때문에 안쓴다.
print(a, b, c)

100 200 300


In [49]:
d, e, f = 100, 200, 300  # tuple 대입
print(d, e, f)

100 200 300


## List 주요 메소드
|메소드|설명|
|:-|-|
|append(value)|value를  추가한다.(1개)|
|extend(List)|List의 원소들을 추가한다.(2개 이상)|
|sort(\[reverse=False\])|원소들을 오름차순 정렬한다. reverse=True로 하면 내림차순정렬 한다.|
|insert(index, 삽입할값)|지정한 index에 '삽입할값'을 삽입한다.|
|remove(삭제할값)|'삭제할값' 값과 같은 원소를 삭제한다.|
|_del list[index] (메소드 X)_ | '삭제할값의 index'값과 같은 원소를 삭제한다|
|index(찾을값\[, 시작index\])|'찾을값'의 index를 반환한다.|
|pop(\[index\])|index의 값을 반환하면서 삭제한다. index 생략하면 가장 마지막 값을 반환하며 삭제한다.|
|count(값)|'값'이 리스트의 원소로 몇개 있는지 반환한다.|
|clear()|리스트 안의 모든 원소들을 삭제한다.|



- append()

In [82]:
l = [1, 2, 3]
print(l)
l.append(10) # 10을 l에 추가
print(l)

[1, 2, 3]
[1, 2, 3, 10]


In [83]:
result = [] # 빈 리스트
# 처리
result.append("첫번째 결과")
# 처리
result.append("두번째 결과")
# 처리
result.append("세번째 결과")
print(result)

['첫번째 결과', '두번째 결과', '세번째 결과']


- extend()

In [84]:
l.extend([100, 200, 300])
print(l)

[1, 2, 3, 10, 100, 200, 300]


- sort(), sorted

In [85]:
l2 = [2, 100, 7, 20, 30, 4, 8]
# 정렬
print(l2)
l2.sort()
print(l2)
l2.sort(reverse = True)
print(l2)

[2, 100, 7, 20, 30, 4, 8]
[2, 4, 7, 8, 20, 30, 100]
[100, 30, 20, 8, 7, 4, 2]


In [86]:
sorted(l2)  #l2를 정렬한 결과 담은 새로운 리스트를 반환 <-> l2.sort()는 결과값을 반환하지 않음
# list 만 아니라 다른 자료구조들도 정렬한다.

[2, 4, 7, 8, 20, 30, 100]

In [98]:
l4 = ['A', 'a', '가', '3', '-']
sorted(l4)

['-', '3', 'A', 'a', '가']

- insert()

In [87]:
l2.insert(2, 1000)
print(l2)

[100, 30, 1000, 20, 8, 7, 4, 2]


- remove(), del

In [88]:
l2.remove(1000) #값으로 삭제, 처음 찾은 한개만 삭제
print(l2)

[100, 30, 20, 8, 7, 4, 2]


In [89]:
l3 = [1, 1, 1, 1, 1]
l3.remove(1)
print(l3)
#print(l3.remove(2)) # 없는 값을 삭제하면 에러(Exception - 예외)발생

[1, 1, 1, 1]


In [90]:
# index로 삭제
print(l2)
del l2[3]
print(l2)

[100, 30, 20, 8, 7, 4, 2]
[100, 30, 20, 7, 4, 2]


- pop()

In [91]:
# 삭제한 뒤에 삭제한 값을 반환
r = l2.pop() # 마지막 index의 값을 삭제하면서 반환
print(r)
print(l2)

2
[100, 30, 20, 7, 4]


In [92]:
r2 = l2.pop(2) # 2번 index의 값을 삭제하면서 반환
print(r2)
print(l2)

20
[100, 30, 7, 4]


- clear()

In [93]:
print(l2)
l2.clear()  # 리스트 삭제
print(l2)
print(len(l2))

[100, 30, 7, 4]
[]
0


- index()

In [96]:
print(l3)
print(l3.index(1)) # 원소값 1이 몇번 index에 있는지 조회, 조회는 앞에서부터 (index 0부터) 찾는다.
print(l3.index(1, 3)) # 원소값 1이 몇번 index에 있는지 조회, 조회는 index 3부터 찾는다.

[1, 1, 1, 1]
0
3


- count()

In [97]:
l3.count(1) # 원소 1이 몇개 있는지?

4

# Tuple (튜플)
- List와 같이 순서대로 원소들을 관리한다. 단 저장된 원소를 변경할 수 없다.
- Tuple 은 각 위치(Index) 마다 정해진 의미가 있고 그 값이 한번 설정되면 바뀌지 않는 경우에 사용한다.  ex) 특정 장소의 위도, 경도
    - Tuple은 값의 변경되지 않으므로 안전하다.
    
## Tuple 생성
- `(value, value, value, ...)`
- 소괄호를 생략할 수 있다.
- 원소가 하나인 Tuple 표현식
    - `(value,)` 또는 `value,` 
        - 값 뒤에 `,` 를 붙여준다. `,`를 붙이지 않으면 ( )가 연산자 우선순위 괄호가 된다. 

In [280]:
t1 = (1, 2, 3, 4, 5)
t2 = ('A', 'B', 'C')
t3 = ('A', 20, True)
t4 = 1, 2, 3, 4, 5
print(t1)
print(t2)
print(t3)
print(t4)

(1, 2, 3, 4, 5)
('A', 'B', 'C')
('A', 20, True)
(1, 2, 3, 4, 5)


In [100]:
print(type(t1))
type(t1)

<class 'tuple'>


tuple

In [102]:
print(type(t1) == tuple)
print(type(t1) == list)

True
False


In [106]:
t5 = (1)
t6 = (1,)
type(t5), type(t6)

(int, tuple)

## Indexing과 Slicing을 이용한 원소(element) 조회
- 리스트와 동일하다.
- 단 튜플은 조회만 가능하고 원소를 변경할 수 없다.

In [103]:
t = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
t

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)

In [104]:
t[0], t[5], t[8] # 원소랑 확인함과 동시에 튜플 생성

(0, 5, 8)

In [108]:
t[0] = 100 # 튜플은 값을 변경할 수 없다.

TypeError: 'tuple' object does not support item assignment

In [115]:
# slicing
print(t)
print(t[2:8:2])
print(t[:8:2])
print(t[::2])
print(t[2:5])
print(t[7:2:-2])
print(t[::-1])

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
(2, 4, 6)
(0, 2, 4, 6)
(0, 2, 4, 6, 8)
(2, 3, 4)
(7, 5, 3)
(9, 8, 7, 6, 5, 4, 3, 2, 1, 0)


## Tuple 연산자
- tuple + tuple
    - 두 tuple의 원소들을 합친 tuple을 반환한다.
- tuple * 정수
    - 같은 tuple의 원소들을 정수번 합친 tuple를 반환한다.  
- in, not in 연산자
    - 값 in tuple
        - tuple의 원소로 값이 **있으면** True, 없으면 False 반환
    - 값 not in tuple
        - tuple의 원소로 값이 **없으면** True, 있으면 False 반환    
- len(tuple)
    - tuple의 원소 개수 반환        

In [117]:
print(t1)
print(t2)

result = t1 + t2
print(result)


(1, 2, 3, 4, 5)
('A', 'B', 'C')
(1, 2, 3, 4, 5, 'A', 'B', 'C')


In [118]:
result2 = t1 * 3 # t1 + t1 + t1
print(result2)

(1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 1, 2, 3, 4, 5)


In [121]:
print("B" in result)
print("가" in result)
print("B" not in result)
print("가" not in result)

True
False
False
True


In [124]:
length = len(t), len(t2), len(result)
type(length)

tuple

In [125]:
# 튜플 대입
len1, len2, len3 = len(t), len(t2), len(result)
print(len1, len2, len3)

10 3 8


## Tuple의 주요 메소드
|메소드|설명|
|:-|-|
|index(찾을값 \[, 시작index\])|'찾을값'이 몇번 index인지 반환한다.|
|count(값)|원소로 '값'이 몇개 있는지 반환한다.|

In [127]:
print(result)

(1, 2, 3, 4, 5, 'A', 'B', 'C')


In [128]:
print(result.index('A'))
# print(result.index('A', 6)) # index 6에서 부터 'A'를 찾는다.
# 없는 값을 찾을 경우 Exception(예외-에러)가 발생.

5


In [129]:
t = (1, 1, 2, 3, 3, 2, 2, 3)
t.count(2)  # 2의 개수

3

# Dictionary
- 값을 키(key)-값(value) 쌍으로 묶어서 저장하는 자료구조이다.
    - 리스트나 튜플의 index의 역할을 하는 key를 직접 지정한다.
    - 서로 의미가 다른 값들을 하나로 묶을 때 그 값의 의미를 key로 가질 수 있는 dictionary를 사용한다.
        - cf) 값의 의미가 같을 경우 List나 Tuple을 사용한다.
    - key-value 쌍으로 묶은 데이터 한개를 **item(파이썬) 또는 entry(자바)**라고 한다.
    
## Dictionary 생성
- 구문
    1. `{ 키 : 값, 키 : 값, 키 : 값 }`
    2. dict(key=value, key=value) 함수 이용
    - 키(key)는 불변(Immutable)의 값들만 사용 가능하다. (숫자, 문자열, 튜플) 일반적으로 문자열을 사용한다.
    - dict() 함수를 사용할 경우 key는 변수로 정의한다

In [133]:
# 사과가 10개, 귤이 20개, ......
# fruit_counts = [10, 20, 50, 70, 90, 5]
# fruit_counts[0]

fruit_counts = {'사과':10, '귤':20, '배':15, '복숭아':70, '수박':5}

# 한 사람의 고객 정보: 이름, 나이, 주소, 직업
customer = {"이름":"홍길동", "나이":"20", "주소":"서울", "직업":"학생"}
print(fruit_counts)
print('-'*10)
print(customer)

{'사과': 10, '귤': 20, '배': 15, '복숭아': 70, '수박': 5}
----------
{'이름': '홍길동', '나이': '20', '주소': '서울', '직업': '학생'}


In [136]:
# key는 중복 허용 X, value는 가능
d = {"name":"홍길동",'nickname':"홍길동"}
print(d)

{'name': '홍길동', 'nickname': '홍길동'}


In [138]:
d2 = {"name":"홍길동","name":"이순신","name":"유관순"}
print(d2) # 마지막에 들어간 값만 남음

{'name': '유관순'}


In [140]:
customer2 = dict(name = "홍길동", age = 30, address = "부산") # key 값은 ""를 치지 않음
print(customer2)

{'name': '홍길동', 'age': 30, 'address': '부산'}


## Dictionary 원소 조회 및 변경
- 조회: index에 key값을 식별자로 지정한다.
    - dictionary\[ key \]
    - 없는 키로 조회 시 KeyError 발생
- 변경
    - dictionary\[ key \] = 값
    - 있는 key값에 값을 대입하면 변경이고 없는 key 일 경우는 새로운 item을 추가하는 것이다.

In [141]:
print(customer)

{'이름': '홍길동', '나이': '20', '주소': '서울', '직업': '학생'}


In [142]:
print("이름:", customer["이름"])
print("직업:", customer["직업"])

이름: 홍길동
직업: 학생


In [144]:
# 없는 키로 조회 -> Exception 발생
customer["키"]

KeyError: '키'

In [145]:
customer["나이"] = 10 # 있는 키의 값을 대입 -> 변경
customer

{'이름': '홍길동', '나이': 10, '주소': '서울', '직업': '학생'}

In [146]:
customer["몸무게"] = 70.58 # 없는 키에 값을 대입 -> 추가
customer

{'이름': '홍길동', '나이': 10, '주소': '서울', '직업': '학생', '몸무게': 70.58}

## Dictionary 연산자

- in, not in 연산자
    - 값 in dictionary
        - dictionary의 **Key**로 값이 **있으면** True, 없으면 False 반환
    - 값 not in tuple
        - dictionary의 **Key**로 값이 **없으면** True, 있으면 False 반환    
- len(dictionary)
    - dictionary의 **Item의 개수** 반환        

In [147]:
print("나이" in customer) # 딕셔너리에 "나이" key가 있는지 여부
print("나이" not in customer) # 딕셔너리에 "나이" key가 없는지 여부

True

In [148]:
10 in customer # key 값만 찾음

False

In [149]:
len(customer) # item의 개수 반환

5

## Dictionary 주요 메소드

|메소드|설명|
|:-|-|
|get(key\[, 기본값\])|key의 item의 값을 반환한다. 단 key가 없을 경우 None또는 기본값을 반환한다.|
|pop(key)|key의 item의 값을 반환하면서 dictionary에서 삭제한다. 없는 key일 경우 KeyError발생(리스트와는 다르게 순서가 없기 때문)|
|clear()|dictionary의 모든 item들을 삭제한다.|
|_del dict\[key\] (메소드 X)_|key의 item을 제거한다.|
|items()|item의 key, value를 튜플로 묶어 모아 반환한다.|
|keys()|key값들만 모아 반환한다.|
|values()|value값들만 모아 반환한다.|

In [150]:
customer

{'이름': '홍길동', '나이': 10, '주소': '서울', '직업': '학생', '몸무게': 70.58}

In [153]:
v = customer.get("키") # key가 없을 경우 None을 반환한다.(default)
print(v)
v2 = customer.get("몸무게")
print(v2)

None
70.58


In [154]:
v = customer.get("키", "키는 수집 못함") # key가 없을 경우 "키는 수집 못함"을 반환한다.
print(v)
v2 = customer.get("몸무게", "몸무게는 수집 못함")
print(v2)

키는 수집 못함
70.58


In [155]:
print(customer)
age = customer.pop('나이')
print(age)
print(customer)

{'이름': '홍길동', '나이': 10, '주소': '서울', '직업': '학생', '몸무게': 70.58}
10
{'이름': '홍길동', '주소': '서울', '직업': '학생', '몸무게': 70.58}


In [156]:
print(customer)
del customer['몸무게']
print(customer)

{'이름': '홍길동', '주소': '서울', '직업': '학생', '몸무게': 70.58}
{'이름': '홍길동', '주소': '서울', '직업': '학생'}


In [160]:
customer.items() # dict_items == 딕셔너리 용 list

dict_items([('이름', '홍길동'), ('주소', '서울'), ('직업', '학생')])

In [161]:
customer.keys()

dict_keys(['이름', '주소', '직업'])

In [165]:
customer.values()

dict_values(['홍길동', '서울', '학생'])

In [166]:
for k, v in customer.items():
    print(k, v, sep=" , ")

이름 , 홍길동
주소 , 서울
직업 , 학생


In [167]:
print(10);print(20) # 이렇게 한줄에 명령문을 2개를 쓸 수는 있지만 쓰지 않는 편이 좋다

10
20


# Set 

- Set은 중복되는 값을 허용하지 않고 순서를 신경 쓰지 않는다.
    - 원소를 식별할 수 있는 식별자가 없기 때문에 Set은 indexing과 slicing을 지원하지 않는다

## Set 생성
- 구문
    - {값, 값, 값 }

> -빈 Dictionary 만들기
>    - info = {}
>    - 중괄호만 사용하면 빈 set이 아니라 빈 dictionary를 생성하는 것임.


In [168]:
s = {1, 2, 3, 4}
print(s)

{1, 2, 3, 4}


In [175]:
s2 = {9, 10, 1, 1, 1, 2, 2, 2, 2, 2, 3, 4, 5, 5, 5, 6, 8, 7} # 중복된 값을 허용하지 않는다.
print(s2)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}


In [176]:
s2[2] # 개별 원소를 조회할 수 없다.

TypeError: 'set' object is not subscriptable

In [177]:
for v in s2:
    #print(v) # 전체 조회하는 것은 가능
    if v == 3:
        print(v)

3


## Set 연산자

- in, not in 연산자
    - 값 in Set
        - Set의 원소로 값이 **있으면** True, 없으면 False 반환
    - 값 not in Set
        - Set의 원소로 값이 **없으면** True, 있으면 False 반환    
- len(Set)
    - Set의 **원소의 개수** 반환        

In [178]:
print(10 in s2) # s2에 10이 있는지 여부
print(10 not in s2) # s2에 10이 없는지 여부

True
False


In [179]:
len(s2)

10

## Set의 주요 메소드

|메소드|설명|
|-|-|
|add(값)|집합에 값 추가|
|update(자료구조)|자료구조내의 원소들을 모두 집합에 추가|
|pop()|원소를 반환하고 Set에서 삭제한다.(set 값을 넣어주면 자동으로 sort가 되기 때문에 무엇을 반환할 지 모름)|
|remove(값)|값을 찾아서 Set에서 삭제한다.|

In [180]:
s2.add(11)
print(s2)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11}


In [181]:
s2.add(-11)
print(s2)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, -11}


In [186]:
s2.add(0)
print(s2)
s2.add('a')
print(s2)
s2.add(-9)
s2.add(-10)
print(s2)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, -11, -9, -8, 'a'}
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, -11, -9, -8, 'a'}
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, -11, -10, -9, -8, 'a'}


In [187]:
s2.update([1,1,1,2,100,200,200,200,300])
print(s2)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 300, 200, 100, -11, -10, -9, -8, 'a'}


In [188]:
s2.update({'a':100, 'b':200})
print(s2)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 300, 'b', 200, 100, -11, -10, -9, -8, 'a'}


In [189]:
v = s2.pop()
print(v)
print(s2)

0
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 300, 'b', 200, 100, -11, -10, -9, -8, 'a'}


In [190]:
s2.remove(7)
print(s2)

{1, 2, 3, 4, 5, 6, 8, 9, 10, 11, 300, 'b', 200, 100, -11, -10, -9, -8, 'a'}


In [191]:
s2.remove(1000) # 없는 것 삭제시 Exception 발생
print(s2)

KeyError: 1000

## Set의 집합연산 연산자 및 메소드

- 합집합
    - 집합A | 집합B
    - 집합A.union(집합B)
- 교집합
    - 집합A & 집합B
    - 집합A.intersection(집합B)
- 차집합
    - 집합A - 집합B
    - 집합A.difference(집합B)

In [192]:
s1 = {1, 2, 3, 4, 5}
s2 = {3, 4, 5, 6, 7}

s3 = s1 | s2  #합집합
print(s1)
print(s2)
print(s3)

{1, 2, 3, 4, 5}
{3, 4, 5, 6, 7}
{1, 2, 3, 4, 5, 6, 7}


In [193]:
print(s1.union(s2))

{1, 2, 3, 4, 5, 6, 7}


In [194]:
s4 = s1 & s2  #교집합
print(s4)

{3, 4, 5}


In [195]:
print(s1.intersection(s2))

{3, 4, 5}


In [197]:
print(s1 - s2)  #차집합

{1, 2}


In [198]:
print(s1.difference(s2))

{1, 2}


# 자료구조 변환 함수

- list(자료구조)
    - 대상 자료구조/Iterable을 List로 변환한다.
- tuple(자료구조)
    - 대상 자료구조/Iterable을 Tuple로 변환
- set(자료구조)
    - 대상 자료구조/Iterable을 Set으로 변환
    - 다른 자료구조의 원소 중 중복을 빼고 조회할 때 set()를 이용해 Set으로 변환한다.
- Dictionary로 변환하는 함수는 없다. (dict는 dictionary를 만드는 함수이다.)
- 변경할 대상이 Dictionary 일 경우에는 key값들만 모아서 변환한다.

> - Iterable
>    - 반복가능한 객체. 반복문(for in)을 이용해 일련의 값들을 반복적으로 각각 제공하는 객체를 말한다. 
>    - 대표적으로 자료구조, 문자열 등이 있다.

In [200]:
l = [1, 2, 2, 2, 3, 3, 3, 2, 1, 2,10, 2, 3, 20, 1]
고유값 = set(l)
print(고유값)

{1, 2, 3, 10, 20}


In [201]:
t = (1, 1, 1, 1, 2, 3, 3, 4)
print(set(t))

{1, 2, 3, 4}


In [202]:
d = {'A':1, 'B':2, 'C':3}
print(set(d))

{'C', 'B', 'A'}


In [203]:
t = (1, 2, 3) # 3->30
l = list(t)
print(l)
l[2] = 30
t = tuple(l)
print(t)

[1, 2, 3]
(1, 2, 30)


In [205]:
a = list("abcdef가나다라1234") # 문자열 -> 리스트
print(a)

['a', 'b', 'c', 'd', 'e', 'f', '가', '나', '다', '라', '1', '2', '3', '4']


In [206]:
tuple("abcde")

('a', 'b', 'c', 'd', 'e')

In [207]:
set("aabceeed")

{'a', 'b', 'c', 'd', 'e'}

# TODO

In [208]:
# 문제 1 ~ 7
jumsu = [100, 90, 100, 80, 70, 100, 80, 90, 95, 85] 
# 위 리스트는 학생번호 1번 ~ 10번까지 10명의 시험 점수이다. 

In [210]:
#(1)  7번의 점수를 출력하세요 
print(jumsu[6])

80


In [212]:
#(2)  1번부터 5번까지의 점수를 출력하세요.
print(jumsu[:5])

[100, 90, 100, 80, 70]


In [213]:
#(3)  4, 5, 6, 7번의 점수를 출력하세요.
print(jumsu[3:7])

[80, 70, 100, 80]


In [250]:
#(4) 짝수번째 점수를 출력하세요.
print(jumsu[1::2])

[90, 80, 100, 90, 85]


In [251]:
#(5) 홀수번째 점수를 출력하세요.
print(jumsu[::2])

[100, 100, 70, 80, 20]


In [216]:
#(6) 9번의 점수를 20으로 변경하고 전체 출력하세요.
jumsu[8] = 20
print(jumsu)

[100, 90, 100, 80, 70, 100, 80, 90, 20, 85]


In [260]:
#(7) 중복된 점수는 제거하고 하나씩만 나오도록 출력하세요.
print(list(set(jumsu)))

[100, 70, 80, 20, 85, 90]


In [261]:
# 문제 8 ~ 9
fruits = ["복숭아", "수박", "딸기"]

In [262]:
#(8) fruits 리스트에 마지막 원소로 "사과", "귤"을 추가하세요.
#fruits.append("사과") # 리스트를 2개 만듬
#fruits.append("귤")
fruits.extend(['사과', '귤'])
#fruits + ['사과', '귤'] # 새로운 리스트를 만듬
print(fruits)

['복숭아', '수박', '딸기', '사과', '귤']


In [225]:
#(9) fruits 리스트에서 "복숭아"를 제거하세요.
fruits.remove("복숭아")
print(fruits)

['수박', '딸기', '사과', '귤']


In [274]:
# 문제 10 ~ 15
#(10)본인의 이름, 나이, email주소, 취미, 결혼유무를 사전(딕셔너리)으로 생성. 
# 취미는 2개 이상의 값을 넣는다..
info = dict(이름="전종민", 나이=24, email주소="jongmin1701@naver.com", 취미=["게임","운동"], 결혼유무=False)
info2 = {
    "이름":"전종민", 
    "나이":24, 
    "email주소":"jongmin1701@naver.com", 
    "취미":["게임","운동"], 
    "결혼유무":False}
print(info)
print(info2)

{'이름': '전종민', '나이': 24, 'email주소': 'jongmin1701@naver.com', '취미': ['게임', '운동'], '결혼유무': False}
{'이름': '전종민', '나이': 24, 'email주소': 'jongmin1701@naver.com', '취미': ['게임', '운동'], '결혼유무': False}


In [275]:
#(11) 위 딕셔너리에서 이름과 email주소를 조회해서 출력하세요.
print(info["이름"], info["email주소"])

전종민 jongmin1701@naver.com


In [276]:
#(12) 위 딕셔너리에서 취미중 두번째 취미를 조회해서 출력하세요.
print(info["취미"][1])

운동


In [277]:
#(13) 위 딕셔너리에 몸무게와 키 항목을 추가하세요.
info['몸무게'] = 60.0
info['키'] = 175
print(info)

{'이름': '전종민', '나이': 24, 'email주소': 'jongmin1701@naver.com', '취미': ['게임', '운동'], '결혼유무': False, '몸무게': 60.0, '키': 175}


In [278]:
#(14) 위 딕셔너리에서 나이를 제거하세요.
del info['나이']
print(info)

{'이름': '전종민', 'email주소': 'jongmin1701@naver.com', '취미': ['게임', '운동'], '결혼유무': False, '몸무게': 60.0, '키': 175}


In [279]:
#(15) 위 딕셔너리에서 email 주소를 다른 값으로 변경하세요.
info['email주소'] = 'jeon.jongmin@gmail.com'
print(info)

{'이름': '전종민', 'email주소': 'jeon.jongmin@gmail.com', '취미': ['게임', '운동'], '결혼유무': False, '몸무게': 60.0, '키': 175}


### Mutable & Immutable 

In [259]:
# Immutable한 값(string, 정수, 실수, 논리, 튜플)
# 변수를 이용해서 다른 변수에 대입한 다음에 다른 변수에서 값을 바꿔도 원본은 안바뀐다.
a = 10
print(a)
b = a
b = 500
print(a, b)

# Mutable한 값(리스트, 셋, 딕셔너리)
# 변수를 이용해서 다른 변수에 대입한 다음에 다른 변수에서 값을 바꾸면 원본도 바뀐다.
a = [1, 2, 3]
print(a)
b = a
b[2] = 4
print(a, b)

10
10 500
[1, 2, 3]
[1, 2, 4] [1, 2, 4]
