# 컬렉션
- 무엇인가를 모은 것
- 파이썬의 컬렉션은 **파이썬에 존재하는 모든 것을** 모을 수 있다.
  - 문법적인 요소들 빼고는 모두 다 모을 수 있다.
  - 데이터, 변수, 함수, 클래스, 오브젝트
- 어떠한 데이터를 모아낸 **구조**
  - **자료구조**
  
## 컬렉션의 종류
- `list`
  - `Sequence` 자료형
  - `Mutable` 자료형
    - 추가된 데이터가 바뀔 수 있다.
  - 중복 데이터 저장이 가능하다.
  - `[]` 또는  `list()` 를 이용해서 만들 수 있다.
  
- `tuple`
  - `Sequence` 자료형
  - `Immutable` 자료형
    - 추가된 데이터가 바뀔 수 없다.
    - `str` 형식의 데이터도 `Immutable`
  - 중복 데이터 저장이 가능하다.
  - `()`를 활용해서 만든다.
  
- `set`
  - `Non-Sequence` 자료형
    - 데이터 저장의 순서를 보장하지 않는다.
  - 중복 데이터의 저장도 허용하지 않는다.
  - **집합**의 개념
  
- **`dict`**
  - `Non-Sequence` 자료형
  - `Key-Value` 구조 자료형

## `list`
- `append()`
  - 리스트의 제일 뒤에 값을 추가한다.
- `sort()`
  - 기본적으로 오름차순 정렬
  - `reverse=True` 설정하면 내림차순 정렬
- `pop()`
  - 제일 뒤에 있는 데이터를 **꺼내고** 삭제

In [1]:
list1 = [1, 2, 3, "four", [5, 6], 7.0, True]
list1

[1, 2, 3, 'four', [5, 6], 7.0, True]

In [2]:
len(list1)

7

In [3]:
# list, tuple은 Sequence기 때문에 index를 사용할 수 있다.

print(list1[3])
print(list1[2])
print(list1[4])

four
3
[5, 6]


In [4]:
print(list1[4][1])

6


In [5]:
list2 = [1, 2]
list2.append(3) # 리스트 내에 아이템을 제일 뒤에 추가
list2

[1, 2, 3]

In [6]:
list3 = [5, 1, 4, 7, 2, 3, 6]
list3.sort() # 오름차순 정렬
list3

[1, 2, 3, 4, 5, 6, 7]

In [7]:
list3.sort(reverse=True) # reverse 옵션을 True로 주면 내림차순
list3

[7, 6, 5, 4, 3, 2, 1]

In [8]:
# .pop() : 제일 뒤에 있는 데이터를 꺼내고 삭제
list1 = [1, 2, 3, "four", [5, 6], 7.0, True]
item = list1.pop()

print(item, " / ", list1)

True  /  [1, 2, 3, 'four', [5, 6], 7.0]


In [9]:
pokemon1 = ['피카츄', '라이츄']
pokemon2 = ['꼬부기', '파이리']

# pokemon1.append(pokemon2) # pokemon1 맨 뒤에 pokemon2를 추가
# pokemon1

In [10]:
pokemon1 + pokemon2 # pokemon1의 아이템과 pokemon2의 아이템을 합쳐준다.(확장)

# 확장된 새로운 리스트가 만들어 진다.

['피카츄', '라이츄', '꼬부기', '파이리']

## `tuple`
- 리스트와 매우 흡사하지만 변경(추가, 삭제, 수정)이 불가
- 튜플은 리스트보다 같은 데이터를 가졌을 때 공간을 적게 사용

In [11]:
# 리스트는 아이템의 수정이 가능하다.
lst = [1, 2, 3]
print(lst)
lst[1] = "리스트는 수정이 가능" # 1번 인덱스 아이템을 수정
print(lst)

[1, 2, 3]
[1, '리스트는 수정이 가능', 3]


In [12]:
# 튜플은 아이템 수정이 불가능
tup = (1, 2, 3)
tup[1] = "hahahaha"
print(tup)

TypeError: 'tuple' object does not support item assignment

In [13]:
# 인덱싱은 가능하다.
print(tup[1])

2


In [14]:
# tuple은 아이템 변경이 불가능한 Immutable 자료형
# str 도 Immutable
text = "abcd"
text[1] = "f" # Error

TypeError: 'str' object does not support item assignment

## 패킹(Packing), 언패킹(UnPacking)
- 패킹 : 데이터를 모아내는 작업
- 언패킹 : 모아낸 데이터를 풀어 놓는 작업

In [15]:
# 패킹
tup = ( 1, "two", 3 )

# 언패킹
item1, item2, item3 = ( 1, "two", 3 )

print(item1)
print(item3)
print(item2)

1
3
two


In [16]:
# 1, 3만 언패킹 하고 싶을 때
tup = (1, 2, 3, 4)

item1, _, item2, _ = tup

## `set`(집합)
- `{}`

In [17]:
# set은 중복 저장이 안된다.
set1 = {1,1,1,1,1,1,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,6,9,9,9,9,9,9,8,8,8,8,8,8}
lst1 = [1,1,1,1,1,1,3,3,3,3,3,3,4,4,4,4,4,4,5,5,5,5,5,5,5,6,6,6,6,6,9,9,9,9,9,9,8,8,8,8,8,8]

print(set1)
print(lst1)

{1, 3, 4, 5, 6, 8, 9}
[1, 1, 1, 1, 1, 1, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 9, 9, 9, 9, 9, 9, 8, 8, 8, 8, 8, 8]


In [18]:
# set은 순서 보장이 안된다.
set2 = {"apple", "banana", "mango", "cherry", "orange"}
lst2 = ["apple", "banana", "mango", "cherry", "orange"]

print(set2)
print(lst2)

{'apple', 'orange', 'cherry', 'mango', 'banana'}
['apple', 'banana', 'mango', 'cherry', 'orange']


수학에서의 **집합**과 동일한 개념
- 교집합 : `intersection`
- 합집합 : `union`
- 차집합 : `difference`
- 부분집합 : `issubset`

In [20]:
A = {1, 2, 3}
B = {2, 3, 4}

In [21]:
A.intersection(B) # A와 B의 교집합

{2, 3}

In [22]:
A.union(B) # A와 B의 합집합

{1, 2, 3, 4}

In [23]:
A.difference(B) # A와 B의 차집합

{1}

In [24]:
# 부분집합 - True / False
C = {2, 3}

In [25]:
C.issubset(A)

True

In [26]:
C.issubset(B)

True

In [27]:
B.issubset(A)

False

In [28]:
# set은 Non-Sequence이기 때문에 인덱스 사용이 불가
A[0]

TypeError: 'set' object is not subscriptable

## `dict`
- `{key : value}`
  - `{key1 : value1, key2 : value2, key3 : value1}`
- `key`의 특징
  - 정수와 문자열로만 설정이 가능하다.
- `value`의 특징
  - 중복 저장 허용한다.
  - 파이썬에 존재하는 모든 데이터 타입이 저장 될 수 있다.

In [29]:
city = {
    "Korea" : "Seoul",
    "Japan" : "Tokyo",
    "Canada" : "Ottawa"
}
print(city)

{'Korea': 'Seoul', 'Japan': 'Tokyo', 'Canada': 'Ottawa'}


In [30]:
# dict에서 데이터를 가지고 올 때는 key를 활용한다.
city["Japan"]

'Tokyo'

In [31]:
# 추가
city["China"] = "Beijing"
city

{'Korea': 'Seoul', 'Japan': 'Tokyo', 'Canada': 'Ottawa', 'China': 'Beijing'}

In [32]:
# 변경
city["Japan"] = "Kyoto"
city

{'Korea': 'Seoul', 'Japan': 'Kyoto', 'Canada': 'Ottawa', 'China': 'Beijing'}

In [33]:
# 삭제
del city["Japan"] # city 딕셔너리에서 키가 Japan인 원소를 삭제
city

{'Korea': 'Seoul', 'Canada': 'Ottawa', 'China': 'Beijing'}

In [34]:
# keys() : 딕셔너리 내의 전체 키를 확인
city.keys()

dict_keys(['Korea', 'Canada', 'China'])

In [35]:
# values() : 딕셔너리 내의 전체 value를 확인
city.values()

dict_values(['Seoul', 'Ottawa', 'Beijing'])

In [36]:
# items() : 딕셔너리 내의 전체 key, value를 튜플 형태로 확인
city.items()

dict_items([('Korea', 'Seoul'), ('Canada', 'Ottawa'), ('China', 'Beijing')])

## 컬렉션 간의 타입 캐스팅

In [37]:
# list -> tuple
lst = [1, 2, 3]
tuple(lst)

(1, 2, 3)

In [38]:
# tuple -> list
tup = (1, 2, 3)
list(tup)

[1, 2, 3]

In [39]:
# list -> set
lst = [1, 1, 2, 3, 4, 4, 6, 6]
set(lst)

{1, 2, 3, 4, 6}

In [40]:
# set -> list
set1 = {"Apple", "Banana", "Mango"}
list(set1)

['Apple', 'Mango', 'Banana']

In [41]:
# 딕셔너리를 리스트로 바꾸면 키만 나온다.
city = {
    "Korea" : "Seoul",
    "Japan" : "Tokyo",
    "Canada" : "Ottawa"
}
list(city)

['Korea', 'Japan', 'Canada']

In [42]:
# 문자열 -> list
text = "hello"
list(text)

['h', 'e', 'l', 'l', 'o']