# II. 파이썬의 핵심 데이터 타입들

+ 반복불가능
  + 숫자, 불값
+ 반복가능
  + 순서없음
    + 집합, <u>***사전***</u>
  + 순서있음
    + 문자열, <u>***리스트, 튜플***</u>

<br>

+ `반복가능`한 데이터 타입들 공통의 함수/메소드들
  + `x in iterable -> bool`(포함되어있는지 아닌지)
  + `len(iterable) -> int`(원소의 총 개수)
  + `sorted(sequence) -> list`
  + `sum(iterable) -> int`(합계)

<br>

+ `반복가능`하고, `순서있는` 데이터 타입들 공통의 함수/메소드들
  + 인덱싱: `sequence[index] -> value`
  + 슬라이싱: `sequence[index:index] -> sequence`
  + `sequence.index(value) -> int`(값의 인덱스)
  + `sequence.count(value) -> int`(값의 개수)

<br>
<br>

### 2-1.`반복`가능하나, `순서`가 없는 데이터타입(`non-sequence`)

+ ***`반복`가능, `순서`없음: 집합, 사전***      
  + (사전은 다른 특징들이 많아서 다음 시간에 다루자)
+ `반복`가능, `순서`있음: 문자열, 리스트, 튜플
+ `반복`불가, `순서`없음: 숫자, 불값
+ ~~`반복`불가, `순서`있음~~

#### 1)집합(`set`, `반복`가능, `순서`없음)

+ ***`반복`가능, `순서`없음: 집합, 사전***
+ `반복`가능, `순서`있음: 문자열, 리스트, 튜플
+ `반복`불가, `순서`없음: 숫자, 불값
+ ~~`반복`불가, `순서`있음~~

<br>

+ **순서가 없기에, 중복된 원소를 허용하지 않는다!!**
+ 반복가능하기에 `in`, `len()`, `sorted()`, `sum()` 사용가능하겠지
+ 집합연산이 가능하다. (합집합, 차집합, 교집합...)

#### 2) 사전(`dictionary`, `반복`가능, `순서`없음)
+ 순서있는 데이터타입들(`문자열, 리스트, 튜플`)이 인덱스로 값을 호출했다면, 딕셔너리는 키로 값을 호출한다.
+ 원칙적으로 사전은 순서없는 데이터 타입이다.
  + <u>그러나, `파이썬 3.7+ 버전`부터는 사전의 요소가 변경되지 않는 한 요소의 순서는 유지된다.</u>
  + 그렇다고 순서가 있는 데이터타입처럼 인덱싱/슬라이싱 등은 불가능하다.


In [None]:
d = {}              ## ❓ 이건 집합인가 사전인가?
print(d, type(d))   ## ❓ 집합을 만들려면 어떻게 해야하는가?

In [None]:
d['key'] = 'value'
print(d)

d[1] = 'a'
print(d)

d['1'] = [1,2,3]
print(d)

d[(1,2,3)] = '1'
print(d)

d[[1,2,3]] = '1'    # ❓❓ 딕셔너리의 key값이 될 수 있는 조건은 뭘까? -> immutable(불변 == hashable)하는 객체만 키값이 될 수 있다! 
print(d)

In [None]:
print(d)
print(d['key'])

In [None]:
d['key'] = 'new value'  ## 이렇게 기존 키에 새로운 값을 할당하면?
print(d['key'])         ## ✅ 값이 추가되는 것이 아니라, 대체되는구나!
print(d)        

##### 2-1) 반복가능 공통의 연산

In [None]:
d = {
    '시': '이창동',
    '중경삼림':'왕가위', 
    '디태치먼트':'토니 케이', 
    '8월의 크리스마스':'허진호',
    '쇼생크 탈출':'프랭크 다라본트',
    '파고': '코엔 형제',
    '마더': '봉준호',
    '이터널 선샤인': '미쉘 공드리',
}

In [None]:
print('시' in d)
print('이창동' in d)

In [None]:
len(d)

In [None]:
sorted(d)

In [None]:
sum(d)

In [None]:
d = {1:10, 2:20, 3:30, 4:40}

print(sum(d))

print(1 in d)
print(20 in d)
print(len(d))
print(sorted(d))

##### 2-2) 딕셔너리의 키, 값, 아이템 확인하기
+ `dict.keys() -> dict_keys`
+ `dict.values() -> dict_values`
+ `dict.items() -> dict_items`

In [None]:
d = {
    '시': '이창동',
    '중경삼림':'왕가위', 
    '디태치먼트':'토니 케이',       ## 이 영화 꼭 보세요. 별로 안유명한데 개띵작임.
    '8월의 크리스마스':'허진호',
    '쇼생크 탈출':'프랭크 다라본트',
    '파고': '코엔 형제',
    '마더': '봉준호',
    '이터널 선샤인': '미쉘 공드리',
}

In [None]:
print(d.keys(), type(d.keys()))     ## ❓❓ 타입이 뭐지?

print(d.keys)                       ## ❓❓❓ 이건 뭘 한거지???

In [None]:
print(d.values())
print(d.values()[0])

In [None]:
print(list(d.values())[0])  ## ❓ list() 함수는 무슨 역할을 하는지 예측해보자!
                            ## ==> 데이터타입간 형변환에 대해서는 곧 배웁니다.

In [None]:
print(d.items())
print(type(d))

In [None]:
items = list(d.items())

print(items[0])     
print(items[0:1])
print(items[0] == items[0:1]) 
## ✅ 인덱싱과 슬라이싱의 결과값이 다르다!! 항상 주의하자!!!!

##### 2-3) 딕셔너리에 값 추가하기/제거하기

In [6]:
d = {}

d[1] = 100
print(d)

{1: 100}


In [7]:
d.update({2:200, 3:300})
print(d)

{1: 100, 2: 200, 3: 300}


In [8]:
d.update(100)
print(d)

TypeError: 'int' object is not iterable

In [None]:
del d[1]
print(d)

###### 참고: 사실 del은 **메모리를 직접 다루는 선언문**으로, 좀 더 범용적으로 쓸 수 있다.
아래 코드를 실행시킨 뒤, varialbe 창을 열어보자. 아예 메모리에서 해당 `l`이 삭제된 것을 확인할 수 있다.

In [None]:
l = [1,2,3]
del l[0]
print(l)

del l
print(l)

In [None]:
print(d)

d.clear()
print(d)        ## ==> 퀴즈 2-3 Q2

## 3.데이터타입간의 형변환
+ 당연히 반복가능 <-> 반복불가 데이터타입간 형변환은 안되겠지?

### 1)문자열
+ 문자열 -> 리스트: **`list()` vs. `str.split(sep)`**
+ 문자열 -> 튜플: `tuple()`
+ 문자열 -> 집합: `set()`. **중복이 제거된다는 사실을 유의하자!**
+ 문자열 -> 사전: `dict()`. 단, 키-값 형식을 잘 맞춰야.

In [None]:
s = '1\t2\t3\t1\t2\t3'   ## ❓ \t의 뜻은??
print(s)

print(
    list(s),
    tuple(s),
    set(s),
    sep = '\n'
)

In [None]:
print(s.split('t'))
print(s.split('\t'))

### 2)리스트
+ 리스트 -> 문자열: **`str()` vs. `'sep'.join(iterble)`**
+ 리스트 -> 튜플: `tuple()`. 가변(mutable)했던 것이 불변(immutable)해진다.
+ 리스트 -> 집합: `set()`. **중복이 제거된다는 사실을 유의하자!**
+ 리스트 -> 사전: `dict()`. 단, 키-값 형식을 잘 맞춰야.

In [3]:
l = ['1', '2', '3']
print(l)

print(
    set(l),
    tuple(l),
)

['1', '2', '3']
{'3', '1', '2'} ('1', '2', '3')


In [4]:
str(l)  ## ✅ str() 메소드는 문자열로 변환하긴 하는데...
        ## ✅ 냅다 모든 걸 문자열로 바꿔버린다!!

"['1', '2', '3']"

In [5]:
''.join(l)

'123'

In [None]:
'+'.join(l)

In [16]:
l = [1,2]
dict(l)

TypeError: cannot convert dictionary update sequence element #0 to a sequence

In [15]:
l = [[1,10], [2,20], [3,30]]
dict(l)

{1: 10, 2: 20, 3: 30}

In [1]:
t = ('ㄱ', 'ㄴ')

'.'.join(t)

'ㄱ.ㄴ'

### 3)튜플
+ 튜플 -> 문자열: **`str()` vs. `'sep'.join(iterble)`**
+ 튜플 -> 리스트: `list()`. 불변했던 것이 가변(mutable)해진다.
+ 튜플 -> 집합: `set()`. **중복이 제거된다는 사실을 유의하자!**
+ 튜플 -> 사전: `dict()`. 단, 키-값 형식을 잘 맞춰야.

<br> 

+ <u>**그래서 대체 리스트와 튜플은 무슨 차이가 있고, 왜 둘 간의 형변환을 하는가?**</u>
  1. `mutable` vs. `immutable`의 차이가 있기 때문이다!
     + 리스트는 `mutable`하다. 따라서 특정 함수/메소드를 적용하면 적용한 리스트 객체 그 자체가 **변화**한다.
     + 그러나 튜플은 `immutable`하다. 따라서 특정 함수/메소드를 적용하더라도, 객체 그 자체가 변화하는 것이 아니라 새로운 객체를 **반환**한다.
  2. 나아가 `mutable`/`immutable` 속성은 `hashable`이라는 속성과도 연관된다. 
     + `mutable`하면 `unhashable`한 것이며, 반대로 `immutable`하면 `hashable`하다고 정리할 수 있다.
       + 리스트는 `mutable`하기에, `unhashable`하고, 따라서 <u>**사전의 키로 활용하거나 집합의 원소로 쓸 수 없다.**</u>
       + 반면, 튜플은 `immutable`하기에, `hashable`하고, 따라서 <u>**사전의 키로 활용하거나 집합의 원소로 쓸 수 있다!!!!**</u>


<br>

+ 참고: `hash`와 `hashable`
  + 이론적으로 `hash`는 특정 값 혹은 객체를 `해쉬값`이라는 고유한 키값으로 다져놓는 것을 뜻한다.
    + 곧, `해쉬값`은 특정 요소 혹은 객체가 가진 **주민등록번호**라고 할 수 있고, `해쉬`는 이러한 **주민등록번호를 만드는 과정**이라고 할 수 있다.
  + 따라서 `해쉬값`만 알면, 우리는 해당 객체에 빠르게 접근할 수 있을 것이다. (참고: [해쉬테이블](https://baeharam.netlify.app/posts/data%20structure/hash-table))
  + 이때, 우리가 매일 모습이 변하는 사람에게 주민등록번호를 부여하기 어렵듯이, 해쉬값 역시 불변하는 객체에 대해서만 부여할 수 있다.
    + **그렇기에 개념적으로 hashable은 immutable과 연결지어 생각하면 좋을 것이다!**
  + 그러나 이렇게 개념적으로 설명하더라도, 컴퓨터가 익숙하지 않다면 여전히 `immutable`이 `hashable`인지 혹은 그 반대인지 헷갈릴 수 있다.
    + 그럴때는 우리가 좋아하는 해쉬브라운 감자튀김을 생각해보자. 감자를 으깨서(`hash`) 해쉬브라운을 만든다.
      + 곧, 감자가 변하지 않는 모양을 가지기에(`immutable`), 으깰 수 있는(`hashable`) 것이다.
    + 반면 물은 어떨까? 물은 모양이 변한다(`mutalbe`). 이런 물은 당연히 으깰 수 없을(`unhashable`) 것이다.

In [None]:
t = ('1',)
print(t, type(t))

print(
    list(t),
    set(t),
    sep = '\n'
)

In [None]:
str(t)

In [None]:
' '.join(t)


In [None]:
t = ((1,2), (3,4), ('a','b'))

print(dict(t))

### 4)집합
+ 집합 -> 문자열: **`str()` vs. `'sep'.join(iterble)`**
+ 집합 -> 리스트: `list()`. 순서가 생긴다!
+ 집합 -> 튜플: `tuple()`. 순서도 생기고 불변해진다!
+ 집합 -> 사전: `dict()`. 단, 키-값 형식을 잘 맞춰야.

In [None]:
s = {1,2,3}

In [None]:
print(
    list(s),
    tuple(s),
)

In [None]:
s = {(1,2), (3,4), (5,6)}
dict(s)

### 5)사전 ✅ 유의할 것 ✅
+ 사전의 형변환은 기본적으로 **키**를 중심으로 이뤄진다!!!
+ 사전 -> 문자열: **`str()` vs. `'sep'.join(iterble)`**
+ 사전 -> 리스트: `list()`. 순서가 생긴다!
+ 사전 -> 튜플: `tuple()`. 순서도 생기고 불변해진다!
+ 사전 -> 집합: `set()`.

In [17]:
d = {'korea': 1, 'yonsei':-100}
print(d, type(d))

print(
    list(d),
    set(d),
    tuple(d),
    sep = '\n'
)

{'korea': 1, 'yonsei': -100} <class 'dict'>
['korea', 'yonsei']
{'korea', 'yonsei'}
('korea', 'yonsei')


In [18]:
str(d)

"{'korea': 1, 'yonsei': -100}"

In [19]:
' vs '.join(d)

'korea vs yonsei'

In [20]:
tuple(d)

('korea', 'yonsei')

In [21]:
set(d)

{'korea', 'yonsei'}

### 집합/사전이 될 수 없는 데이터타입?
+ ✅ `mutable`, 즉 `unhashable`한 데이터타입!

In [None]:
print(
    set([1,2,3]),
    set('123'),
    set(['123', '456'])
)


In [None]:
print(set([[1,2,3], ['456']]))

In [None]:
dict([1,2,3,4])

In [None]:
dict([(1,2), (3,4), (5,6)])

In [None]:
n = 1
s = 'ㄱㄴㄷ'
t = (1,2,3,4)


dict(
    (
        (n, 1), (s, len(s)), (t, len(t))
    )
)

In [None]:
l = [1,2]
t = (1,2,3,4)



dict(
        (
            (l, len(l)), (t, len(t))
        )
    )

In [None]:
s = {1,2,3}
t = (1,2,3,4)


dict(
        (
            (s, len(s)), (t, len(t))
        )
    )

### (주의) `list(iterable)` vs. `[iterable]`


In [2]:
t = (1,2,3)

lt = list(t)
til = [t]

print(
    type(lt),
    type(til)
)               ## 둘 다 타입은 리스트이지만...

<class 'list'> <class 'list'>


In [4]:
print(
    lt,
    til,
    sep = '\n'
)
## 전자는 튜플을 리스트로 바꾼 것이지만, 
## 후자는 **리스트 안에 튜플**을 담은 것이다!

[1, 2, 3]
[(1, 2, 3)]


In [7]:
s = {1,2,3}

ts = tuple(s)
sit = (s,)      ## ✔ 반드시 , 찍어줘야!!!!

print(
    type(ts), type(sit)
)

print(
    ts, sit
)               ## 마찬가지로 둘 다 튜플이지만, 출력값은 다르다!

<class 'tuple'> <class 'tuple'>
(1, 2, 3) ({1, 2, 3},)


## ⏰⏰ 데이터타입 구분 총정리 ⏰⏰

+ 반복불가
  + ~~반복불가 순서있음~~
  + 반복불가 순서없음: 숫자, 불,
    + 사칙연산, 확장할당연산자
    + 비교연산자

<br>

+ 반복가능 (공통: `in`, `len()`)
  + 반복가능 순서없음
    1. 집합
       + 사칙 연산 중 유일하게 `- (차집합)`만 가능하다!
       + 집합 연산자 (`|, &, -, ^`)
         + 확장할당연산자도 가능했지 (`|=, &=, -=, ^=`)
       + `|, |=, add, update` 차이
    2. 사전
       + 키와 값으로 관리한다!
         + 키는 반드시 immutable(==hasahble)
  + 반복가능 순서있음(공통: `+, *, 인덱싱, 슬라이싱, s.count(), s.index()`)
    1. 문자열
       + 1-1) 문자열의 내용 바꾸는 메서드(`str.replace(), str.upper(), str.lower()...`)
       + 1-2) 좌or우의 공백/문자를 제거하는 strip류 메서드(`str.strip(), str.rstrip(), str.lstrip()`)
       + > 단, **문자열 내용을 실제로 바꾸는 것은 아니다! 따라서 `재할당이 필요`하다!!**
       + 1-3) 불값을 반환하는 메서드(`str.islower(), isnumeric()...`)
    2. 리스트
       + 2-1) 값 추가하기 (`list.append(a_value), list.insert(index, value), list.extend(iterable), list += new_list`)
       + 2-1) 값 제거하기 (`list.remove(a_value), list.pop(index), list.clear()`)
       + 2-2) 정렬, 뒤집기 (`list.sort(), list.reverse()`)
       + > 리스트 **내용을 실제로 변화시킨다!! 값이 변하거나, 순서가 바뀐 리스트를 반환하는 것이 아니다!! 따라서 `재할당하면 안된다!!`**
    3. 튜플
       + 하나의 원소만 있는 튜플은 반드시 `,` 찍어줘야 (ex. `(1,)`)
       + 고유한 메소드 없음.