# 튜플 고급내용

## 튜플을 왜 쓸까? (1)

`-` 책의 설명 (이 설명이 꼭 파이썬에 한정되는 것은 아님. 모든 언어에 존재하는 불변형 객체에 적용가능한 설명)

- 실수방지 
- 빠르다, 다중작업에 유리하다, 여러사람과 작업하기에 유리하다, 깊은복사/얕은복사시 원하지않는 오류(side effect이라고 함)를 방지할 수 있다, 메모리관리에도 유리함... 
- 느낌: 불변형은 기능제한이 있는데 가볍고 빠른, 가변형은 기능은 풍부하지만 약간 느리고 무거운 느낌임 (불변형:라면사리, 가변형:라면) 

## 슬기로운 튜플사용 ($\star\star\star\star\star$)

`-` 예제: 여러변수를 동시에 출력하고 싶을 경우 (다중출력?)

변수를 아래와 같이 선언하였다고 하자. 

In [4]:
a=1
b=2
c=3 

선언된 값을 확인하려면? 

In [5]:
a

1

In [6]:
b

2

In [7]:
c

3

튜플을 이용하면? 

In [8]:
a,b,c # 괄호하나 생략하는것이 이렇게 편하다..

(1, 2, 3)

`-` 예제: 다중할당1 (여러개의 변수를 동시에 선언하고 싶을 경우) 

In [9]:
name, age, sex, height, weight = 'Tom', 20, 'M', 180, 70 

In [10]:
name, age, sex, height, weight

('Tom', 20, 'M', 180, 70)

In [11]:
height

180

`-` 예제: 다중할당2, 위도와 경도

In [12]:
coor = (37,127) # 서울 
coor

(37, 127)

In [13]:
lat, long = coor

In [14]:
lat 

37

In [15]:
long 

127

`-` 잠깐만: 다중할당은 꼭 튜플에서만 가능한가? 

그건 아니다... 

In [16]:
[x,y,z] = [1,2,3] 
x,y,z # 다중출력 

(1, 2, 3)

In [17]:
[x,y] = 'hi'
x,y 

('h', 'i')

튜플과 같이 사용하면 가독성이 극대화 (그래서 다중할당은 거의 튜플과 세트로 사용함) 

In [18]:
x,y,z = 1,2,3
x,y,z # 다중출력 

(1, 2, 3)

In [19]:
x,y = 'hi'
x,y 

('h', 'i')

`-` 예제: 임시변수 사용없이 두 변수의 값을 교환 

In [20]:
a=10
b=20

In [21]:
a,b = b,a 

In [22]:
a

20

In [23]:
b

10

`-` 예제: for문과 튜플

In [24]:
lst = [['guebin', 202112345, 'M'],
       ['iu',202254321, 'F'],
       ['hodong', 202011223, 'M']]
lst

[['guebin', 202112345, 'M'],
 ['iu', 202254321, 'F'],
 ['hodong', 202011223, 'M']]

In [25]:
for i in lst: 
    print(i)

['guebin', 202112345, 'M']
['iu', 202254321, 'F']
['hodong', 202011223, 'M']


In [26]:
for name,studentid,sex in lst: 
    print(name)

guebin
iu
hodong


In [27]:
for name,studentid,sex in lst: 
    print(name,sex)

guebin M
iu F
hodong M


`-` 예제: for문과 튜플, dummy variable `_` 

In [28]:
for name,studentid,sex in lst: 
    print(studentid)

202112345
202254321
202011223


In [29]:
for _,studentid,_ in lst: 
    print(studentid)

202112345
202254321
202011223


In [30]:
for _,_,sex in lst: 
    print(sex)

M
F
M


In [31]:
for name,_,sex in lst: 
    print(name,sex)

guebin M
iu F
hodong M


In [32]:
for name,_  in lst: 
    print(name)

ValueError: too many values to unpack (expected 2)

In [33]:
for name,*args  in lst: 
    print(name)

guebin
iu
hodong


`-` 예제: 튜플과 언패킹연산자 `*` 

In [34]:
head, body, *tail = range(1,11) 
head, body, tail

(1, 2, [3, 4, 5, 6, 7, 8, 9, 10])

In [35]:
head1,head2, *body, tail1,tail2,tail3 = range(1,11) 
head1,head2, body, tail1,tail2,tail3 

(1, 2, [3, 4, 5, 6, 7], 8, 9, 10)

In [36]:
*head, body, tail = range(1,11) 
head, body, tail

([1, 2, 3, 4, 5, 6, 7, 8], 9, 10)

(관찰) 

그러고 보니까.. 
```python
head1,head2, body, tail1,tail2,tail3  = (1, 2, [3,4,5,6,7], 8, 9, 10)
head1,head2, *body, tail1,tail2,tail3   = (1, 2, 3,4,5,6,7, 8, 9, 10)
```
이렇다는 거잖아? 

`*`를 붙이면 1차원 자료구조가 풀린다..? 

In [37]:
*[1,2,3]

SyntaxError: can't use starred expression here (<ipython-input-37-63179bdb9a80>, line 1)

In [38]:
print([1,2,3])

[1, 2, 3]


In [39]:
print(*[1,2,3]) ## 이런 느낌이란 말이지..

1 2 3


## 튜플을 왜 쓸까? (2)

`-` 책의 설명 (이 설명이 꼭 파이썬에 한정되는 것은 아님. 모든 언어에 존재하는 불변형 객체에 적용가능한 설명)

- 실수방지 
- 빠르다, 다중작업에 유리하다, 여러사람과 작업하기에 유리하다, 깊은복사/얕은복사시 원하지않는 오류(side effect이라고 함)를 방지할 수 있다, 메모리관리에도 유리함... 
- 느낌: 불변형은 기능제한이 있는데 가볍고 빠른, 가변형은 기능은 풍부하지만 약간 느리고 무거운 느낌임 (불변형:라면사리, 가변형:라면) 

`-` 내 설명: 소괄화 생략할 수 있어서 쓰는거야

- 튜플의 장점은 소괄호의 생략에 있음 (이것은 파이썬과 줄리아만 가능)
- 소괄호생략 + 언패킹 $\Rightarrow$ 엄청난 가독성
- 컴공과 사람들 의견: 튜플 + 언패킹 $\Rightarrow$ 엄청난 가독성 $\Rightarrow$ 충격 $\Rightarrow$ "파이썬 편하더라고요.."

In [40]:
def mycal(a,b):
    return a+b, a-b, a*b, a/b  #여러개의 값을 리턴하는듯 보임. -> 사실은 길이가 4인 튜플 1개를 리턴

In [41]:
mycal(2,3)

(5, -1, 6, 0.6666666666666666)

In [42]:
_, _, mulrslt, _ = mycal(2,3) # 병렬할당 

In [43]:
mulrslt

6

`-` 의문: 왜 튜플만 괄호를 생략할 수 있지? 

답이 없는 문제인데 답을 해보겠습니다. 

- 튜플을 먼저 만들고, 괄호를 생략하는 문법을 추가한것은 아닐것임
- 원래 괄호없이 컴마만 대충찍어서 선언가능한 아주간단한 타입의 벡터형을 만들고 싶었을 것임. 
- 왜? 괄호없는 벡터를 만들고, 언패킹을 사용하면 여러가지 구문들이 엄청나게 간단해짐. 
- 컴마컴마로 선언하는 벡터는 한 두번 쓰고 버리는 경우가 많으며 대부분 이름도 필요없음 $\to$ 원소에 접근해서 sorting하여 순서를 바꾸고 싶다던가 원소를 추가할 이유가 없음 $\to$ 비싼 가변형으로 만들 이유가 없다는 것.. 
- 우리가 필요한 것: 데이터가 벡터의 형태로 모여있기만 하면 된다!

# 잡기술 (하지만 유용해)

## 인덱싱고급 (스트라이딩) 

`-` 스트라이딩 [start:stop:step] 

In [44]:
lst = list('abcdefgh')
lst

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [45]:
lst[0:8:2]

['a', 'c', 'e', 'g']

`-` 생략

In [46]:
lst[::2]

['a', 'c', 'e', 'g']

In [47]:
lst[0::2]

['a', 'c', 'e', 'g']

In [48]:
lst[:8:2]

['a', 'c', 'e', 'g']

`-` 예제: 짝수/홀수 원소 추출 

In [49]:
lst

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [50]:
lst[::2] # 1,3,5,7, ... 

['a', 'c', 'e', 'g']

In [51]:
lst[1::2] # 2,4,6,8, ... 

['b', 'd', 'f', 'h']

`-` step = -1 이면? 

In [52]:
lst

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [53]:
lst[::-1]

['h', 'g', 'f', 'e', 'd', 'c', 'b', 'a']

- reverse와 같은 기능

(reverse)와 비교

관찰1: reverse 메소드는 리스트 자체를 변화시킴

In [54]:
lst = list('abcdefgh')
lst

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [55]:
lst.reverse() #리버스는 
lst

['h', 'g', 'f', 'e', 'd', 'c', 'b', 'a']

관찰2: [::-1]는 리스트는 변화시키지 않음

In [56]:
lst = list('abcdefgh')
lst

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

In [57]:
lst[::-1]

['h', 'g', 'f', 'e', 'd', 'c', 'b', 'a']

In [58]:
lst

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h']

`-` 사실 -step은 쓰는 것이 조금 까다롭다. 

(예제) 처음과 끝을 생략하지 않고 아래와 동일한 효과를 주는 코드를 만들어 보자. 

In [59]:
lst = list('abcdefgh')
lst[::-1]

['h', 'g', 'f', 'e', 'd', 'c', 'b', 'a']

(풀이)

결국 lst[?:?:-1]의 꼴에서 적당히 ?의 값을 채우면 된다. 

In [60]:
lst[-1::-1] # 일단 첫 시작은 제일 마지막 원소 

['h', 'g', 'f', 'e', 'd', 'c', 'b', 'a']

In [61]:
lst[-1:0:-1] # 앗 마지막 인덱스는 포함 안되는거였지? 

['h', 'g', 'f', 'e', 'd', 'c', 'b']

In [64]:
lst[-1:-1:-1] # 우짜지??

[]

잠깐 인덱스를 생각해보자. 

|a|b|c|d|e|f|g|h|
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|0|1|2|3|4|5|6|7|
|**-8**|-7|-6|-5|-4|-3|-2|**-1**|

In [65]:
lst[-1:-9:-1] # 아..

['h', 'g', 'f', 'e', 'd', 'c', 'b', 'a']

결론: -step을 자주 쓰진 말자?

## 컴프리헨션 고급 (if문이 포함된 컴프리헨션) 

`-` 예제: 제곱수중에서 12로 나누어 떨어지는 수만 원소로 가지는 리스트를 만들고 싶다. 
- 제곱수: 1,4,9,16,25,36, ... 
- 12로 나누어 떨어지는 수: 36, ... 

(예비학습)

In [69]:
12 % 4 # %는 나머지를 계산하는 연산자, 12를 4로 나누면 나머지가 0

0

In [70]:
12 % 5 # %는 나머지를 계산하는 연산자, 12를 5로 나누면 나머지가 2

2

(풀이1)

In [74]:
lst = [] 
for i in range(1,101): 
    if (i**2 % 12 == 0): 
        lst.append(i**2)

In [75]:
lst

[36,
 144,
 324,
 576,
 900,
 1296,
 1764,
 2304,
 2916,
 3600,
 4356,
 5184,
 6084,
 7056,
 8100,
 9216]

(풀이2)

In [76]:
[i**2 for i in range(1,101) if (i**2 % 12 == 0)]

[36,
 144,
 324,
 576,
 900,
 1296,
 1764,
 2304,
 2916,
 3600,
 4356,
 5184,
 6084,
 7056,
 8100,
 9216]

## 함수고급 (조건부리턴)

`-` 홀수/짝수를 판별하는 함수 만들기 1

In [35]:
def test(a):
    if a % 2 ==0: 
        return 'even'
    else:
        return 'odd'

In [36]:
test(1)

'odd'

In [37]:
test(2)

'even'

In [38]:
test(3)

'odd'

In [39]:
test(4)

'even'

In [40]:
[test(a) for a in range(1,11)]

['odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even']

`-` 홀수/짝수를 판별하는 함수 만들기 2

In [41]:
def test(a):
    return 'even' if a%2 ==0 else 'odd'

In [42]:
test(3)

'odd'

In [43]:
[test(a) for a in range(1,11)]

['odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even']

## len함수 

`-` 0차원 자료형은 len함수가 동작하지 않음 

In [44]:
a=1 
len(a)

TypeError: object of type 'int' has no len()

In [45]:
a=True
len(a)

TypeError: object of type 'bool' has no len()

In [46]:
a=3.14
len(a)

TypeError: object of type 'float' has no len()

> note: 이것이 어떠한 수학적인 의미를 가지거나 0차원의 본질적진리를 뜻하는 것은 안미. R에서는 1,3.14,TRUE의 길이가 1로 존재함. 

`-` 1차원 자료형은 len함수가 동작

In [47]:
a='guebin'
len(a)

6

In [48]:
a=[1,2,3,4,5,6]
len(a)

6

In [49]:
a=1,2,3,4,5,6 
len(a)

6

In [50]:
a=range(10)
len(a)

10

`-` 길이가 1인 1차원 자료형과 0차원 자료형은 다른것임 

In [51]:
a='g'
len(a)

1

In [52]:
a=[1] 
len(a)

1

In [53]:
a=(1,)
len(a)

1

In [54]:
a=range(1)
len(a)

1

`-` 길이가 0인 1차원 자료형도 존재함 

In [55]:
a=''
len(a)

0

In [56]:
a=[]
len(a)

0

In [57]:
a=()
len(a)

0

In [58]:
a=range(0)
len(a)

0

# 딕셔너리 

## intro: str, list, tuple 정리

`-` str, list, tuple은 모두 시퀀스형이라는 공통점이 있다. $\to$ 원소의 위치번호로 인덱싱이 가능 

In [59]:
lst = [1,2,3,4]

In [60]:
lst[0] # 위치번호=0

1

In [61]:
lst[-1] # 위치번호=-1

4

`-` str, list, tuple은 차이점도 존재함. 잠깐 정리해보자. 

***시퀀스형의 카테고리***

- 컨테니어형: list, tuple 
- 균일형: str 
- 가변형: list 
- 불변형: tuple, str 

***표로 정리하면***

||컨테니어형|균일형|
|:-:|:-:|:-:|
|가변형|list|.|
|불변형|tuple|str|

`-` 시퀀스형이 아닌 1차원 자료형도 있을까? 원소의 위치번호로 인덱싱이 불가능한 자료형 

`-` 왜 이런게 필요할까? 
- 벡터에서 원소를 뽑는것은 정보의 모임에서 정보를 검색하는 것과 같다. 
- 정보를 `순서`대로 나열한뒤에 그 `순서`를 이용하여 검색하는 방법은 유용하다. 
- 하지만 경우에 따라서는 `키워드`를 기억해서 그 `키워드`를 바탕으로 정보에 접근하는 방법이 유용할 수 있다.  

***카카오톡 대화내용검색*** 

(상황1) `오늘아침`에 와이프가 `뭔가`를 카톡으로 부탁했었음. 그런데 그 `뭔가`가 기억안남. 

(상황2) `개강전에` 동료교수와 함께 `저녁약속`을 카톡으로 잡았었음. 그런데 그게 언제인지 기억안남. 

(상황3) `오늘아침` 동료교수와 함께 `점심약속`을 카톡으로 잡았었음. 그런데 그 장소가 기억나지 않음. 

`-` 순서대로 정리된 자료를 검색할때는 시퀀스형이 유리하다. 그런데 키워드로 검색하고 싶을 경우는 딕셔너리 타입이 유리하다. 

## 선언 

`-` 방법1

In [62]:
score={'guebin':49, 'iu':80}
score

{'guebin': 49, 'iu': 80}

In [63]:
type(score)

dict

`-` 방법2

In [64]:
score=dict(guebin=49, iu=80)
score

{'guebin': 49, 'iu': 80}

In [65]:
type(score)

dict

`-` 방법3 

In [66]:
_lst = [['guebin',49],['iu',80]]
_lst 

[['guebin', 49], ['iu', 80]]

In [67]:
dict(_lst)

{'guebin': 49, 'iu': 80}

`-` 방법4

In [68]:
_tpl = ('guebin',49), ('iu',80)
_tpl

(('guebin', 49), ('iu', 80))

In [69]:
dict(_tpl)

{'guebin': 49, 'iu': 80}

## 원소추출 

In [70]:
score = {'guebin':49, 'iu':80}
score

{'guebin': 49, 'iu': 80}

guebin의 점수를 추출하고 싶다면? 

In [71]:
score[0] # 이렇게 뽑는것이 아니고! 

KeyError: 0

In [72]:
score['guebin'] 

49

`-` 리스트로 저장했다면? 

In [73]:
score=[['guebin',49],['iu',80]]
score

[['guebin', 49], ['iu', 80]]

guebin의 점수를 추출하고 싶다면? 

(방법1)

In [74]:
score[0][1] # guebin의 점수를 출력하란 의미

49

(방법2)

In [75]:
_keys = [score[i][0] for i in range(len(score))] # 리스트컴프리헨션
_keys

['guebin', 'iu']

In [76]:
[score[i][1] for i in range(len(score)) if score[i][0] =='guebin' ] 

[49]

- 어지럽죠? 

## 원소추가, 변경, 삭제

In [77]:
score={'guebin':49, 'iu':80}
score

{'guebin': 49, 'iu': 80}

`-` 원소에 접근 

In [78]:
score['guebin']

49

`-` 추가

In [79]:
score['hynn'] = 99 # 추가 
score 

{'guebin': 49, 'iu': 80, 'hynn': 99}

`-` 변경 

In [80]:
score['iu'] = 99  # 변경 
score 

{'guebin': 49, 'iu': 99, 'hynn': 99}

`-` 삭제 

(방법1)

In [81]:
score={'guebin':49, 'iu':80, 'hynn':99}
del score['guebin']  
score

{'iu': 80, 'hynn': 99}

(방법2)

In [82]:
score={'guebin':49, 'iu':80, 'hynn':99} 
score.pop('guebin')

49

In [83]:
score

{'iu': 80, 'hynn': 99}

`-` 참고로 리스트였다면 이러한 삭제작업역시 비효율적이었을 것임 

In [84]:
score = [['guebin',49],['iu',80],['hynn',99]] 
score

[['guebin', 49], ['iu', 80], ['hynn', 99]]

In [85]:
score = [[key,val] for key,val in score if key != 'guebin'] 
score

[['iu', 80], ['hynn', 99]]