# 컨테이너(Container)

여러 개의 값을 저장할 수 있는 것(객체)을 의미하며, `서로 다른 자료형`을 저장 할 수 있습니다.

### 컨테이너 분류
- 시퀀스(Sequence)형 : 순서가 있는(ordered) 데이터
- 비 시퀀스(Non-sequence)형 : 순서가 없는(unordered) 데이터

<img width="712" alt="container" src="https://user-images.githubusercontent.com/45934087/148164052-3b12d3a2-a95e-4d4d-ae25-86ca1ba9657b.png">

## 시퀀스(sequence)형 컨테이너

`시퀀스`는 데이터가 순서대로 나열된(ordered) 형식을 나타냅니다. 

* **주의! 순서대로 나열된 것이 `정렬되었다(sorted)`라는 뜻은 아닙니다.**

### 특징
1. 순서가 있습니다.

2. **특정 위치의 데이터를 가리킬 수 있습니다.**

### 종류
파이썬에서 기본적인 시퀀스 타입은 다음과 같습니다.

* 리스트(list)

* 튜플(tuple)

* 레인지(range)

* *문자형(string)*

* *바이너리(binary)* : 다루지 않습니다.



### 리스트 (List)

<center><img src="https://user-images.githubusercontent.com/18046097/61180421-fe90ae80-a650-11e9-8211-d06f87756d05.png", alt="list figure"/></center>

**생성과 접근**
```python
[value1, value2, value3]
```

리스트는 대괄호`[]` 및 `list()` 를 통해 만들 수 있습니다.

In [None]:
# 빈 list를 만들어봅시다.
# 변수명 list1 인 list를 대괄호로 만들어봅시다.
# 변수명 list2 인 list를 list()로 만들어 봅시다.
# 두 변수의 타입을 출력해 봅시다.

In [None]:
list1 = []  # 내가 직접 만들 때
list2 = list()  # 다른 자료형을 list로 바꿀 때

type(list1), type(list2)

In [None]:
# 원소를 포함한 list를 만들어 봅시다.
# 변수명이 locations인 list에 지역 5곳을 원소로 포함해 만들어 봅시다.
# 변수 locations을 출력해 봅시다.
# locations의 타입을 출력해 봅시다.

In [None]:
# 리스트/튜플의 변수명은, 반드시 복수형 단어로 짓는다!!!

locations = ['서울', '경기', '인천', '강원', '충청']

In [None]:
# locations의 첫번째 값을 인덱스로 접근해 봅시다.

In [None]:
locations[0]


순서가 있는 시퀀스로 인덱스를 통해 접근 가능합니다.
- 값에 대한 접근은 `list[idx]` 방식으로 접근합니다.

![image](https://user-images.githubusercontent.com/45934087/148164331-f0ff4193-6b05-4d99-bbde-dd1eef13b0b1.png)


In [None]:
# 변수 boxes에 문자열 'A', 'B', 리스트 ['apple', 'banana', 'cherry']를 할당합니다.

In [None]:
boxes = ['A', 'B', ['apple', 'banana', 'cherry']]

In [None]:
# boxes의 길이를 len 함수를 이용하여 출력해 봅시다.

In [None]:
len(boxes)

In [None]:
# boxes의 3번째 요소를 인덱스로 접근하여 출력해 봅시다.

In [None]:
boxes[2]

In [None]:
# boxes의 3번째 요소들 중, 마지막 요소를 negative index로 접근하여 출력해 봅시다.

In [None]:
boxes[2][-1]  # ['apple', 'banana', 'cherry'][-1]

In [None]:
# boxes의 마지막 요소들 중, 두번째 요소의 첫번째 문자열을 출력해 봅시다.

In [None]:
boxes[-1][1][0]

#### 리스트의 변경(Mutate)

In [None]:
l = [1, 2, 3, 4, 5]
print(id(l))

# mutate (변경)
l[0] = 100
l[2] = '300'
l[4] = 500

print(l, id(l))

In [None]:
l = [1, 2, 3, 4, 5]
print(id(l))

# re-assignment (재할당)
l = [100, 2, '300', 4, 500]
print(l, id(l))

### 튜플 (Tuple)

**생성과 접근**
```python
(value1, value2)
```

튜플은 리스트와 유사하지만, `()`로 묶어서 표현합니다.

- tuple은 수정 불가능(불변, immutable)합니다.

- 직접 사용하기 보다는 파이썬 내부에서 다양한 용도로 활용되고 있습니다.

In [None]:
# tuple을 만들어봅시다.
# 변수명이 my_tuple인 tuple을 만들어 봅시다. 단, 무작위 정수 2개를 포함하여 만듭니다.
# my_tuple의 타입을 출력해 봅시다.

In [None]:
my_tuple = (2, 5)
type(my_tuple)

In [None]:
# 아래와 같은 방식으로도 만들 수 있습니다.

In [None]:
l = [1, 2, 3]
tuple(l)

**튜플 생성 주의 사항**
- 단일 항목의 경우

In [None]:
# 하나의 항목으로 구성된 튜플은 생성 시 값 뒤에 쉼표를 붙여야 합니다.
# 아래 코드를 실행하여 변수 a의 타입을 확인해 봅시다.

In [None]:
a = (1, )
type(a)

In [None]:
# 변수명이 single_tuple인 하나의 요소(값)로 구성된 tuple을 만들어 봅시다. (길이가 1)
# 하나의 요소(값)로 구성된 tuple은 값 뒤에 쉼표를 붙여서 만듭니다.
# single_tuple의 타입을 출력해 봅시다.
# single_tuple의 길이를 출력해 봅시다.

In [None]:
single_tuple = (100, )

len(single_tuple)

In [None]:
# 길이가 1인 tuple을 만들 때 쉼표가 없는 경우 어떻게 되는지 확인 해봅시다.

In [None]:
b = (1)
type(b)

- 복수 항목의 경우

In [None]:
# 마지막 항목에 붙은 쉼표는 생략 할 수 있습니다.
# 아래 코드를 실행하여 변수 b와 c의 타입을 확인해 봅시다.

In [None]:
b = (1, 2, 3, )
c = (4, 5, 6)

type(b), type(c)

> Trailing Comma (맨 마지막에 , 찍기)
>
> 모든 스타일 가이드에서 권장.
> 여러줄로 컨테이너를 만들 때 필수.

```python

l1 = [1, 2, 3, 4, 5]

l2 = [
    'apple',
    'banana',
    'cherry',  # 마지막 요소 후에 미리 , 찍어 놓기!
]
```

**튜플 대입**
- 우변의 값을 좌변의 변수에 한번에 할당하는 과정을 의미합니다.
- 튜플은 일반적으로 파이썬 내부에서 활용됩니다.
    - 추후 함수 파트에서 복수의 값을 반환하는 경우에도 확인할 수 있습니다.

In [None]:
# 파이썬 내부에서는 다음과 같이 활용됩니다. (변수 및 자료형 예제에서 사용된 코드입니다.)

In [None]:
a, b = 1, 2

In [None]:
# 실제로는 tuple로 처리됩니다.
(a, b) = (3, 4)

print(a, b)

In [None]:
# 변수의 값을 swap하는 코드 역시 tuple을 활용하고 있습니다. 
(a, b) = (b, a)

print(a, b)

In [None]:
# 변수명이 empty인 빈 tuple을 만들어 봅시다.
# 빈 tuple은 빈 괄호 쌍으로 만들어집니다.
# empty의 타입을 출력해 봅시다.
# empty의 길이를 출력해 봅시다.

empty = ()
type(empty), len(empty)

**튜플 접근**

순서가 있는 자료형이기 때문에, idx 접근이 가능합니다.

In [None]:
t = (1, 2, 3, 4, 5)

t[0], t[3], t[-1]

#### 튜플 변경 (mutate)

**불가능**

In [None]:
t = (1, 2, 3, 4, 5)
print(id(t))

# 재할당은 변경이 아니다!
t = (1, 200, 3, 400, 5)
print(id(t))

In [None]:
t = (1, 2, 3, 4, 5)

# 접근은 가능
print(t[1])

# 변경은 불가능 (immutable)
t[1] = 200

### 레인지 (range())

`range` 는 정수의 시퀀스를 나타내기 위해 사용됩니다.

기본형 : `range(n)` 


> 0부터 n-1까지 값을 가짐


범위 지정 : `range(n, m)` 

> n부터 m-1까지 값을 가짐

범위 및 스텝 지정 : `range(n, m, s)`

> n부터 m-1까지 +s만큼 증가한다

In [None]:
# range를 만들어봅시다.
# 0부터 2까지 값을 가지는 range를 만들고 타입을 출력해 봅시다.

In [None]:
r = range(0, 10)
print(type(r))

In [None]:
# 0부터 9까지 값을 가지는 range를 만들고 list로 형 변환을 해 봅시다.
# 작성한 range를 list()로 감싸 형 변환 할 수 있습니다.

In [None]:
r1 = range(0, 10)
r2 = range(10)

list(r1), list(r2)

In [None]:
# 4부터 8까지의 숫자를 담은 range를 만들고 list로 형 변환을 해 봅시다.

In [None]:
list(range(4, 9))

In [None]:
# range(start, end, [step, ])을 활용합니다.
# 0부터 -9까지 담긴 range를 만들고 list로 형 변환을 해 봅시다.
# 출력 결과는 다음과 같습니다.
# [0, -1, -2, -3, -4, -5, -6, -7, -8, -9]

In [None]:
r2 = range(0, 10, 2)
list(r2)

r3 = range(0, -10, -1)
list(r3)

In [None]:
# 1 ~ 100 까지의 짝수만 모으기
print(list(range(2, 101, 2)))

# 1 ~ 100 까지의 7의 배수만 모으기
print(list(range(7, 101, 7)))

#### range 자료형의 접근

In [None]:
# range < sequnce 
# idx 접근 가능

r = range(10)
r[0], r[-1]

#### range 자료형의 변경 (X)

In [None]:
# 내부 값 변경 불가능(immutable)

r = range(10)
r[0] = 10

### 패킹 / 언패킹 연산자 (Packing / Unpacking Operator)
모든 시퀀스형(리스트, 튜플 등)은 패킹/언패킹 연산자 * 를 사용하여 객체의 패킹 또는 언패킹이 가능합니다.
```python
x, *y = i, j, k ...
```

**패킹**
- 대입문의 좌변 변수에 위치합니다.
- 우변의 객체 수가 좌변의 변수 수보다 많을 경우 객체를 순서대로 대입합니다.
- 나머지 항목들은 모두 별 기호 표시된 변수에 리스트로 대입합니다.

In [None]:
# x 를 패킹을 통해 저장해 봅시다.

In [None]:
x, y, *z = 1, 2, 3, 4, 5, 6
print(x, y, z)

# x, *y, *z = 1, 2, 3, 4, 5, 6
# y와 z가 몇개를 묶는다는것을 알 수 없음 => 에러

**언패킹**
- argument 이름이 *로 시작하는 경우, argument unpacking이라고 부릅니다.
- 패킹의 경우, 리스트로 대입합니다.

In [None]:
def multiply(x, y, z):
    return x * y * z

- 언패킹의 경우, 튜플 형태로 대입합니다.

In [None]:
numbers = [1, 2, 3]
# multiply(numbers)  # multiply([1, 2, 3])
multiply(*numbers)  # multiply(1, 2, 3) 

**패킹/언패킹 연산자 주의사항**

` * ` 연산자가 곱셈을 의미하는지 패킹/언패킹 연산자인지 구분하여야 합니다.
- 패킹/언패킹 연산자의 경우
    1. 연산자가 대입식의 좌측에 위치하는 경우
    2. 연산자가 단항 연산자로 사용되는 경우
        - 단항 연산자 : 하나의 항을 대상으로 연산이 이루어지는 연산자
        
        
- 산술연산자의 경우
    1. 연산자가 이항연산자로 사용되는 경우
        - 이항 연산자 : 두 개의 항을 대상으로 연산이 이루어지는 연산자

## 비 시퀀스형(Non-sequence) 컨테이너

- 세트(set)

- 딕셔너리(dictionary)

### 세트 (Set)

`set`은 순서가 없고 중복된 값이 없는 자료구조입니다.

* `set`은 수학에서의 집합과 동일하게 처리됩니다. 

* `set`은 중괄호`{}`를 통해 만들며, 순서가 없고 중복된 값이 없습니다.

* 담고있는 객체를 삽입, 변경, 삭제 가능 (mutable) 합니다.

* 빈 세트를 만들려면 `set()`을 사용해야 합니다. (`{}`로 사용 불가능)

* 활용 가능한 연산자는 차집합(`-`), 합집합(`|`), 교집합(`&`)입니다.

**생성과 접근**
```python
{value1, value2, value3}
```

In [None]:
# set 두개를 만들어서 연산자들을 활용해봅시다.

In [None]:
set_a = {1, 2, 3}
set_b = {9, 6, 3}

* 차집합은 연산자 `-`를 사용합니다.

In [None]:
# set_a와 set_b의 차집합을 구해봅시다.

In [None]:
set_a - set_b

* 합집합은 연산자 `|`를 사용합니다.

In [None]:
# set_a와 set_b의 합집합을 구해봅시다.

In [None]:
set_a | set_b

* 교집합은 연산자 `&`을 사용합니다.

In [None]:
# set_a와 set_b의 교집합을 구해봅시다.

In [None]:
set_a & set_b

In [None]:
# set은 중복된 값이 있을 수 없습니다.

In [None]:
set_c = {1, 1, 1, 2, 2, 3, 3, 3}
set_c

* `set`을 활용하면 `list`의 중복된 값을 손쉽게 제거할 수 있습니다.
* 단, `set`으로 변환하는 순간 순서를 보장할 수 없습니다.

In [None]:
# set으로 중복된 값을 제거해봅시다.
# 문자열 서울, 서울, 대전, 광주, 서울, 대전, 부산, 부산를 원소로 가지는 set를 만듭니다.
# 생성한 세트의 길이를 출력해 봅시다.

In [None]:
locations = [1, 1, 2, 3, 1, 2, 4, 4]
set(locations), len(set(locations))

In [None]:
# 생성한 세트를 출력해 봅시다.
# 세트는 순서를 보장하지 않습니다.
s = 'qwerasdf'
l = list(s)
set_l = set(l)

print(set_l)
list(set_l)

### 딕셔너리 (dictionary)

`dictionary`는 `key`와 `value`가 쌍으로 이뤄져있습니다.


<center><img src="https://user-images.githubusercontent.com/18046097/61180427-1405d880-a651-11e9-94e1-1cc5c2a2ff34.png"></center> 

**생성과 접근**

```python
{Key1:Value1, Key2:Value2, Key3:Value3, ...}
```

* `{}`를 통해 만들며, `dict()`로 만들 수 있습니다.
* 순서를 보장하지 않습니다.
* `key`는 **변경 불가능(immutable)한 데이터**만 가능합니다. (immutable : string, integer, float, boolean, tuple, range)
* `value`는 `list`, `dictionary`를 포함한 모든 것이 가능합니다.

In [None]:
# 비어있는 dictionary를 두가지 방법으로 만들어봅시다.
# {}와 dict()로 만들 수 있습니다.
# 두 변수의 타입을 출력해 봅시다.

d1 = {}
d2 = dict()

print(d1, d2)

In [None]:
# dictionary에 중복된 key는 존재할 수 없습니다.

In [None]:
d = {1: 1, 2: 2, 3: 3, 1: 4, 2: 1}  # 중복된 key가 있다? 잘못 만든 dict
d

In [None]:
# 지역번호가 담긴 전화번호부를 만들어봅시다.
# 변수 phone_book에 key를 지역명, value를 지역번호로 가지는 원소를 작성합니다.
# 예) 서울 - 02

In [None]:
phone_book = {
    '서울': '02',
    '경기': '031',
    '인천': '032',
    '강원': '033',
    '경북': '054',
}

In [None]:
# 위에서 작성한 phone_book이 가지고 있는 key 목록을 확인 해 봅시다.
# dictionary의 .keys() 메소드를 활용하여 key를 확인 해볼 수 있습니다.

phone_book.keys()  # 함수 O, 메서드 O

In [None]:
# 위에서 작성한 phone_book이 가지고 있는 value 목록을 확인 해 봅시다.
# 딕셔너리의 .values() 메소드를 활용하여 value를 확인 해볼 수 있습니다.

phone_book.values()

In [None]:
# 위에서 작성한 phone_book이 가지고 있는 key와 value 목록을 확인 해 봅시다.
# 딕셔너리의 .items() 메소드를 활용하여 key, value를 확인 해볼 수 있습니다.

phone_book.items()

#### 딕셔너리 접근과 변경

In [2]:
d = {'a': 1, 'b': 2, 'c': 3}

In [3]:
# key 로 접근 => value 추출

d['a']

1

In [4]:
# key 로 접근 => value 를 변경
d['a'] = 100

d

{'a': 100, 'b': 2, 'c': 3}

# 형변환(Type conversion, Typecasting)

파이썬에서 데이터타입은 서로 변환할 수 있습니다.

- 암시적 형변환
- 명시적 형변환

## 컨테이너형 형변환

파이썬에서 컨테이너는 서로 변환할 수 있습니다.

<img width="708" alt="typecasting" src="https://user-images.githubusercontent.com/18046097/61180466-a6a67780-a651-11e9-8c0a-adb9e1ee04de.png">


In [None]:
# 하나의 결과를 확인 한 후, 주석 `#` 을 활용하여 이전의 코드를 비활성화 합니다.
# 형변환 후의 결과를 확인 합니다.

In [None]:
# list를 형변환 해봅시다.
l = [1, 2, 3, 4]

# str(l) 
# tuple(l)
# set(l)    # list => set => list (중복이 제거된 리스트)
# range(l)  => X
# dict(l)  => X

In [None]:
# tuple을 형변환 해봅시다.
t = (1, 2, 3, 4)

# str(t)
# list(t)
# set(t)
# range(t)  => X
# dict(t)  => X

In [None]:
# range를 형변환 해봅시다.
r = range(1, 5)

# str(r)
# list(r)  # N ~ M 의 정수로 이루어진 리스트 만들기
# set(r)
# tuple(r)
# dict(r)  => X

In [None]:
# set을 형변환 해봅시다.
s = {1, 2, 3, 4}

# str(s)
# list(s)
# tuple(s)
# range(s)  => X
# dict(s)  => X

In [None]:
# dictionary를 형변환 해봅시다.
d = {'name': 'yu', 'year': 2023}

# str(d)
# list(d)
# tuple(d)
# set(d)
# range(d)  => X

# 정리
## 컨테이너(Container)
<center><img src="https://user-images.githubusercontent.com/18046097/61180439-44e60d80-a651-11e9-9adc-e60fa57c2165.png", alt="container"/></center>

## 시퀀스형 연산자(Sqeuence Type Operator)

### 산술 연산자 (+)
시퀀스를 연결(concatenation)할 수 있습니다. 

In [None]:
# 두 list [1, 2] 와 ['a'] 를 + 를 이용하여 합쳐봅시다.

In [None]:
[1, 2] + ['a']

In [None]:
# 두 튜플 (1, 2) 와 ('a',) 를 + 를 이용하여 합쳐봅시다.

In [None]:
t1 = (1, 2)
t2 = ('a', )

t3 = t1 + t2

print(id(t1), id(t2), id(t3))

In [None]:
# range에는 사용할 수 없습니다.
# range(1), range(2, 5) 를 + 를 이용하여 합치고자 할 때 발생하는 오류를 확인해 봅시다.

In [None]:
range(1) + range(2, 5)

In [None]:
# 두 문자열 '12' 와 'a' 를 + 를 이용하여 합쳐봅시다.

In [None]:
'12' + 'a'
'a' + '12'

### 반복 연산자 (*)
시퀀스를 반복할 수 있습니다.

In [None]:
# 리스트 [0] 을 *을 이용해 8번 반복해봅시다.

In [None]:
[0] * 8

In [None]:
# 튜플 (1, 2) 를 * 을 활용해 3번 반복해봅시다.

In [None]:
(1, 2) * 3

In [None]:
# range에는 사용할 수 없습니다.
# range(1) 을 * 연산자로 3번 반복하려고 할 때 발생하는 오류를 확인해 봅시다.

In [None]:
range(1) * 3

In [None]:
# 문자열 'hi' 를 * 을 활용해 3번 반복해봅시다.

In [None]:
'hi' * 3

## 기타 : 인덱싱/슬라이싱 (Indexing/Slicing)
`[]`를 통한 값을 접근하고, `[:]`을 통해 슬라이싱할 수 있습니다. (data structure 챕터에서 자세하게 학습합니다.)

### 인덱싱
시퀀스의 특정 인덱스 값에 접근 할 수 있습니다.
- 해당 인덱스가 없는 경우 IndexError가 발생합니다.

In [None]:
# 리스트를 인덱싱을 통해 값에 접근해봅시다.
# 리스트 [1, 2, 3]의 세번째 값을 인덱싱으로 확인해봅시다.

In [5]:
[1, 2, 3][2]

3

In [None]:
# 튜플을 인덱싱을 통해 값에 접근해봅시다.
# 튜플 (1, 2, 3)의 첫번째 값을 인덱싱으로 확인해봅시다.

In [6]:
(1, 2, 3)[0]

1

In [None]:
# range를 인덱싱을 통해 값에 접근해봅시다.
# range(3)의 세번째 값을 인덱싱으로 확인해봅시다.

In [7]:
range(3)[2]

2

In [None]:
# 문자열을 인덱싱을 통해 값에 접근해봅시다.
# 문자열 'abc'의 첫번째 값을 인덱싱으로 확인해봅시다.

In [8]:
'abc'[0]

'a'

In [None]:
# 찾고자 하는 인덱스가 존재하지 않을때 오류가 발생합니다.
# 문자열 apple의 100번째 값을 인덱싱으로 확인하고자 할 때 발생하는 오류를 확인해봅시다.

In [9]:
'apple'[100]

IndexError: string index out of range

### 슬라이싱
- Sequence[start:end[:step]]

시퀀스를 특정 단위로 슬라이싱 할 수 있습니다.

In [10]:
# 아래 코드들을 실행한 결과를 확인하여 슬라이싱의 작동 원리를 파악해봅시다.
print([1, 2, 3, 4][1:4])
print((1, 2, 3)[:2])
print(range(10)[5:8])
print('abcd'[2:4])  # slice 마지막 인덱스가 더 크더라도, 에러가 발생하지 않는다.

[2, 3, 4]
(1, 2)
range(5, 8)
cd


시퀀스를 `k` 간격으로 슬라이싱 할 수 있습니다.

In [None]:
# 아래 코드들을 실행한 결과를 확인하여 슬라이싱의 작동 원리를 파악해봅시다.
# 문자열, 튜플, 레인지에서 모두 동일하게 동작합니다.


In [11]:
# 아래의 코드를 실행하여 결과를 확인해 봅시다.
s = 'abcdefghi'  # idx 0 ~ 8

In [13]:
print(s[:3])  # 시작 ~ 3 => 시작, 1, 2 => 'abc'
print(s[5:])  # 5 ~ 끝 => 5, 6, 7, 끝 => 'fghi'
print(s[::])
print(s[::-1])

abc
fghi
abcdefghi
ihgfedcba


In [24]:
# idx 의 시작 => 0
# idx 의 끝 => len() - 1
s[::2]
print(s[2:5:-1])  # [Start 할 숫자 : End 할 숫자 : 움직일 방향+칸수]
print(s[5:2:-1])


fed


[5, 3]

# 정리

## 변수(Variable)와 자료형(Data Type)

<center><img width=800 height=400 src="https://user-images.githubusercontent.com/9452521/87640197-55a7f280-c781-11ea-9cff-19c022ce704a.png", alt="variable"/></center>


## 컨테이너(Container)
<center><img src="https://user-images.githubusercontent.com/18046097/61180439-44e60d80-a651-11e9-9adc-e60fa57c2165.png", alt="container"/></center>

## 함수 (Function)
- 특정 명령을 수행하는 함수 묶음을 말합니다.

In [25]:
def multiply(x, y, z):
    return x * y * z


multiply(5, 6, 3)

90

## 모듈 (Module)
- 단일 `.py` 파일을 의미합니다
- 함수 / 클래스의 모음 또는 하나의 프로그램을 구성하는 단위를 의미합니다.

## 패키지 (Package)
- 프로그램과 모듈의 묶음을 의미합니다.
    - 프로그램 : 실행하기 위한 것
    - 모듈 : 다른 프로그램에서 불러와 사용하기 위한 것
![module](https://user-images.githubusercontent.com/45934087/148158664-3798bd68-a9fa-4c21-be01-874bada7c11c.png)


## 라이브러리 (Library)
- 패키지의 모음을 의미합니다.
![Library](https://user-images.githubusercontent.com/45934087/148158810-466f417d-f950-4ac0-abcb-321e0577d043.png)