# 튜플
변경 가능하지 않은 데이터의 묶음인 튜플을 알아본다.
> *리스트와 유사하지만 튜플이 한번 만들어지면 값은 변경할 수 없다.*

***

## 튜플의 연산

### 특징
* 임의의 객체들이 순서를 가지는 모임(리스트와 유사한 면이 많음).
* 변경 불가능한 자료형.
* 리스트가 가지고 있는 것만큼 다양한 메서드가 없다.
* 시퀀스 자료형이므로 시퀀스형의 인덱싱과 슬라이싱, 연결하기, 반복하기, 길이정보 등의 일반적인 연산을 모두 가진다.
* 튜플은 () (소괄호)로 표현.

#### 소괄호 () 를 사용하지 않아도 쉼표 , 로 데이터가 구분되면 튜플로 처리한다.
```
t = 1, 2, 3
```

#### 소괄호 () 는 수식에서의 ()와 혼동될 가능성이 있기 때문에 주의 해야한다.
```
r = (1)은 r = 1로 해석
데이터가 하나인 튜플은 괄호의 사용과 상관없이 r = (1,) 또는 r = 1,
```

In [5]:
r = (1)
print(type(r))

<class 'int'>


In [6]:
# 데이터가 한 개일 떄는 반드시 쉼표가 있어야 한다.
r = (1,)
type(r)

tuple

In [7]:
# 괄호는 없어도 쉼표는 있어야 한다.
r = 1,
type(r)

tuple

#### 시퀀스 자료형의 일반적인 연산을 사용한 예

In [9]:
t = 1, 2, 3
# 반복하기
t * 2

(1, 2, 3, 1, 2, 3)

In [10]:
# 연결하기
t + ('PyKUG', 'users')

(1, 2, 3, 'PyKUG', 'users')

In [11]:
# 인덱싱과 슬라이싱
print(t[0], t[1:3])

1 (2, 3)


In [12]:
# 길이 정보
len(t)

3

In [13]:
# 멤버 검사
1 in t

True

#### 변경이 불가능한 자료형이어서 값을 변경할 수는 없다.

In [14]:
# 허용이 안 되며 에러가 발생한다.
t[0] = 100

TypeError: 'tuple' object does not support item assignment

#### 검색에 관련된 메서드

In [15]:
t = (1, 2, 3, 2, 2, 3)
# 2가 몇 개 있는가?
t.count(2)

3

In [16]:
# 첫 번째 2의 위치는?
t.index(2)

1

In [18]:
# 2 위치부터 검색해 나간다.
t.index(2, 2)

3

#### 중첩 가능

In [19]:
t = (12345, 54321, 'hello!')
u = t, (1, 2, 3, 4, 5)
u

((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

#### 좌우 변에 복수 개의 데이터를 치환 가능

In [24]:
x, y, z = 1, 2, 3
(x1, y1), (x2, y2) = (11, 12), (13, 14)
print(x, y, z)
print(x1, y1, x2, y2)

1 2 3
11 12 13 14


#### 스왑 가능

In [40]:
x, y = 1, 2
x, y = y, x
x, y

(2, 1)

## 패킹과 언패킹
#### 패킹  (Packing)   : 한 데이터에 여러 개의 데이터를 넣는 것
* t = 1, 2, 'hello'
#### 언패킹(Unpacking) : 한 데이터에서 데이터를 각각 꺼내 오는 것
* x, y, z = t

#### 리스트도 언패킹을 지원함.

In [46]:
a = ['foo', 'bar', 4, 5]
print(a)
x, y, z, w = a
print(x, y, z, w)

['foo', 'bar', 4, 5]
foo bar 4 5


#### 확장된 언패킹(Extended Unpacking)

In [48]:
T = (1, 2, 3, 4, 5)
a, *b = T
print(a, b)

1 [2, 3, 4, 5]


In [49]:
*a, b = T
print(a, b)

[1, 2, 3, 4] 5


In [50]:
a, b, *c = T
print(a, b, c)

1 2 [3, 4, 5]


#### *a와 같은 식의 표현은 나머지 전부를 의미한다 따라서 다음과 같은 표현은 있을 수 없다.

In [51]:
a, *b, *c = T

SyntaxError: two starred expressions in assignment (<ipython-input-51-2333a48782d3>, line 1)

## 리스트와의 차이점
### 공통점
* 임의의 객체를 저장할 수 있다.
* 시퀀스 자료형.
### 차이점
* 변경 불가능한 시퀀스 자료형.
* 함수의 가변 인수를 지원한다.
#### 변경해야할 데이터들은 리스트에, 변경하지 말아야 할 데이터는 튜플에 저장.
#### 리스트와 튜플은 list()와 tuple()내장 함수를 사용하여 상호 변환 가능.

In [52]:
T = (1, 2, 3, 4, 5)
L = list(T)
L[0] = 100
L

[100, 2, 3, 4, 5]

In [53]:
T = tuple(L)
T

(100, 2, 3, 4, 5)

### 튜프의 활용
#### 함수에 있어서 하나 이상의 값을 반환할 때

In [56]:
# 튜플을 반환한다.
def calc(a, b):
    return a + b, a * b
x, y = calc(5, 4)
x, y

(9, 20)

#### 함수의 인수로 사용할 떄

In [59]:
# calc(4, 5)와 동일하다.
args = (4, 5)
calc(*args)

(9, 20)

#### 파이썬2 형식의 서식 문자열에 데이터를 공급할 떄

In [60]:
"%d %f %s" % (12, 3.456, 'hello')

'12 3.456000 hello'

## 이름 있는 튜플(namedtuple)
### 튜플에 이름으로 접근할 수 있도록 관련 기능을 추가한 것
#### 모듈 collections의 namedtuple()함수로 객체를 생성
* namedtuple(typename, field_names, verbose=False, rename=False)
* 인수 field_names는 이름들을 공백으로 구분하는 문자열로 전달

In [62]:
from collections import namedtuple
Point = namedtuple('Point', 'x y')
print(Point)

<class '__main__.Point'>


In [63]:
# namedtuple()함수는 Point 클래스를 만든다.
Point.__name__

'Point'

In [64]:
pt1 = Point(1.0, 5.0)
pt2 = Point(2.5, 1.5)
pt1

Point(x=1.0, y=5.0)

In [67]:
from math import sqrt
length = sqrt((pt1.x - pt2.x) ** 2 + (pt1.y - pt2.y) ** 2)
length

3.8078865529319543

In [68]:
# 첨자 참조 가능으로
length = sqrt((pt1[0] - pt2[0]) ** 2 + (pt1[1] - pt2[1]) ** 2)
length

3.8078865529319543

## 예제:경로명 다루기
#### 튜플을 사용하는 예로 os.path 모듈의 경로명을 다루는 함수(split)를 살펴보자.

In [73]:
# 상대 경로를 절대 경로로 반환한다.
import os
p = os.path.abspath('t.py')
p

'C:\\SPB_Data\\t.py'

In [74]:
# 파일의 존재 여부를 검사한다.
os.path.exists(p)

True

In [76]:
# 파일 크기를 확인한다.
os.path.getsize(p)

39

In [77]:
# (head, tail)로 분리한다(디렉터리명, 파일 이름)
os.path.split(p)

('C:\\SPB_Data', 't.py')

In [79]:
# 디렉터리와 파일 이름을 결합한다.
os.path.join('c:\\work','t.hwp')

'c:\\work\\t.hwp'

In [80]:
# 파일 이름을 정규화한다.
os.path.normpath('c:\\work\\.\\t.hwp')

'c:\\work\\t.hwp'

In [81]:
os.path.splitext('c:\\work\\t.hwp')

('c:\\work\\t', '.hwp')

#### 같은 의미를 나타내지만 운영 체제마다 다른 기호를 사용하는 경우가 있다. 파이썬은 운영 체제의 독립성을 유지하기 위해서 이러한 내용을 os모듈의 일부 이름에 표현해 놓았다. 이들을 이용해 프로그램하면 이식할 떄 생기는 문제를 미리 예방할 수 있다.
* os.linesep : 파일에서 줄을 구분하는 문자.윈도우에서는 \r\n, 유닉스에서는 \n
* os.sep     : 경로명에서 각 요소를 구분하는 문자.윈도우에서는 \, 유닉스에서는 /
* os.pathsep : 경로명과 경로명을 구분하는 문자. 윈도우에서는 ;, 유닉스에서는 :
* os.curdir  : 현재 디렉터리를 나타내는 문자. 윈도우와 유닉스 계열에서는 .
* os.pardir  : 상위 디렉터리를 나타내는 문자. 윈도우와 유닉스 계열에서는 ..
* os.devnull : null장치에 대한 파일 경로. 유닉스 계열에서는 /dev/null이고 윈도우 계열에서는 nul
* os.extsep  : 파일 이름과 확장자를 구분하는 문자. 대부분 .을 사용
## 예제:URL 다루기
### urllib.parse 모듈은 Uniform Resource Locator(URL)을 성분별로 분해하거나 결합하는 인터페이스 제공
#### urlparse()함수 : URL을 다음과 같이 분리하여 튜플을 반환한다.
* (addressing scheme, network location, path, parameters, query, fragment, identifier)

In [82]:
from urllib.parse import urlparse
a = 'http://some.where.or.kr:8080/a/b/c.html;param?x=1&y=2#fragment'
r = urlparse(a)
r

ParseResult(scheme='http', netloc='some.where.or.kr:8080', path='/a/b/c.html', params='param', query='x=1&y=2', fragment='fragment')

In [83]:
r.scheme

'http'

#### urlunparse()함수 : 튜플로 표현된 성분들을 하나의 URL로 역변환한다.
* 튜플의 구성순서는 urlparse()함수의 출력과 같다.

In [84]:
from urllib.parse import urlparse, urlunparse
a = 'http://some.where.or.kr:8080/a/b/c.html;param?x=1&y=2#fragment'
u = urlparse(a)
urlunparse(u)

'http://some.where.or.kr:8080/a/b/c.html;param?x=1&y=2#fragment'

#### urljoin()함수 : 기본 URL과 상대 URL을 연결하여 절대 URL을 만든다.

In [89]:
from urllib.parse import urljoin
b = 'http://some.where.or.kr:8080/a/b/c.html;param?x=1'
urljoin(b, 'd.html')

'http://some.where.or.kr:8080/a/b/d.html'

* 스킴(Scheme, 프로토콜명, 예: http)과 네트워크 위치만 얻으려면 다음과 같이 /를 이용한다.

In [90]:
urljoin(b, '/')

'http://some.where.or.kr:8080/'