# 데이터 타입
프로그램은 데이터를 가공해 결과를 생성  
데이터 타입은 가공에 필요한 연산 구분  
파이썬은 사용자 관점의 추상화된 데이터 표현 제공  
파이썬 기본 타입 : 숫자(정수 실수 복소수), 논리(boolean), 시퀀스, 연관, 클래스  
구조체, 공용체는 지원하지 않음

## 숫자와 논리타입
숫자 타입은 정수, 실수, 복소수로 구분  
정수 타입은 메모리가 허용하는 한도에서 매우 큰 정수 표현  
부호가 있는 정수 표현을 사용하므로 signed, unsigned 속성이 없음  
복소수 타입은 복소수 표현  
실수 타입은 배정도 실수 표현  
논리 타입은 논리 연산 결과 표현

## 열거타입
열거 타입은 가능한 값의 범위가 나열 형태로 정의되는 이름이 부여된 읽기 전용 상수 표현  
파이썬은 기본 타입으로 지원하지 않고 enum 모듈의 Enum 클래스로 지원

In [1]:
from enum import Enum
class Color(Enum):
    red = 1
    green = 2
    blue = 3
    
print(Color.red.value)
print(Color.green.value)
print(Color.blue.value|Color.red.value)

1
2
3


## 컨테이너 타입
컬렉션의 일종인 컨테이너는 구조화된 저장소로 시퀀스와 연관으로 구분  
시퀀스는 배열과 같이 순서를 갖는 데이터 구조로 문자열, 리스트, 튜플로 구분  
문자열 타입은 문자열만 관리하는 추상 타입  
연관은 고유한 키로 값의 저장 위치를 결정하며 딕셔너리와 집합으로 구분  
컨테이너에 포함되는 대상을 요소라 하며 내장함수 len()으로 개수 파악

## 사용자 정의 타입
사용자 정의 타입은 클래스로 표현하며 객체지향 개념 지원 > 클래스 멤버는 속성(변수)과 메소드(함수)로 구분  
파이썬은 정의한 클래스 자체도 하나의 객체!  
실체화는 클래스 객체를 복제해 동일 타입의 새로운 객체를 만드는 행위 > 인스턴스 객체  
인스턴스 객체는 자신만의 속성을 가질 수 없다 > C언어의 구조체와 호환

In [2]:
class Person:
    def __init__(self):
        self.name = None
        self.tel = None
        self.addr = None
        
one = Person()
two = Person()

one.name = "youngeun"
one.tel = "01012345678"
two.name = "youngho"
two.tel = "01087654321"

In [3]:
one

<__main__.Person at 0x2036a4f5e48>

In [4]:
two

<__main__.Person at 0x2036a4eabe0>

In [5]:
one.name

'youngeun'

In [6]:
two.name

'youngho'

## 타입 검사
객체의 타입은 클래스 객체  
내장 함수 type()은 클래스 객체의 이름인 타입 반환  
int(정수), float(실수), complex(복소수), str(문자열), bool(논리), list(리스트), tuple(튜플), dict(딕셔너리)`, set(집합)

In [7]:
type(1)

int

In [11]:
type(1.2)

float

In [12]:
type(1+2j)

complex

In [8]:
type("love you")

str

In [10]:
type(True)

bool

In [13]:
type([1, 2, 3])

list

In [14]:
type((1, 2))

tuple

In [16]:
type({"I":10})

dict

In [17]:
type({1,2,3})

set

## 타입 크기
타입의 크기는 sys 모듈의 getsizeof()함수로 확인  
타입이 적용된 객체의 크리를 바이트로 반환함

In [18]:
from sys import getsizeof
getsizeof(10)

28

In [19]:
getsizeof(True)

28

In [20]:
getsizeof((1,2,3))

72

## 객체 고유 속성
모든 객체는 식별자 및 참조 개수와 같은 속성을 가짐  
식별자는 객체의 고유성을 나타내는 정수로 식별자가 같으면 동일한 객체  
변수에는 식별자가 대입됨  
참조 개수는 얼마나 많은 곳에서 객체를 참조하는지 알려주는 정수이다

## 바인딩
바인딩은 속성과 객체 또는 기호와 연산을 연관시키는 행위  
파이썬은 실행 시간에 바인딩 발생 > 동적 바인딩  
변수는 대상의 참조를 저장하므로 실행 중에 대상이 바뀌면 의미도 바뀜

In [21]:
def you(): print("it's you")
def me(): print("it's me")
    
box = 1
print(box)

1


In [22]:
box = you
box()

it's you


In [23]:
box = me
box()

it's me


## 존속 시간
존속 시간은 객체를 위해 할당한 메모리 공간이 회수되기 전까지 바인딩을 유지하는 시간  
정수, 실수 ,문자열은 리터럴 표현에 따라 미리 생성한 객체를 사용하거나 최초 사용될 때 새로운 객체 생성  
함수가 클래스는 정의할 때 객체 생성  
해당 객체를 참조하는 곳이 없으면 내장된 쓰레기 수집기가 유휴 시간에 객체 제거  
키워드 del 은 참조 변수의 이름 사용을 막아 빠른 객체 소멸 유도  

## 존속 시간과 참조 카운트
sys 모듈의 getrefcount() 함수는 존속 시간을 파악할 수 있는 객체의 참조 카운트 반환  
객체가 생성되거나 생성된 객체를 참조하는 곳이 생길 때마다 1씩 증가  
참조 카운트의 초기 값은 대상의 재사용 화귤(높을 수록 큰 값)에 따라 다름  
객체를 참조하는 곳이 없어질 때마다 1씩 감소  
참조 카운트가 0이면 쓰레기 수집기에 의해 해당 객체 제거

In [24]:
from sys import getrefcount
a = 1
getrefcount(a)

2539

In [25]:
b = a
getrefcount(a)

2541

In [26]:
del b
getrefcount(a)

2539

## 초기 참조 카운트 값
정수 0 ~ 256 은 파이썬 전체에서 중복 사용될 확률이 매우 높으므로 초기 참조 카운트 값이 매우 큼  
클래스처럼 인스턴스를 통해 복제될 확률이 높은 객체는 초기 참조 카운트 값이 큼  
리스트, 집합, 딕셔너리, 함수와 같이 재사용성이 낮은 객체는 참조 카운트가 1부터 시작

## 객체의 참조 카운트 확인
gerrefcount() 함수는 실제 참조 카운트보다 1 큰 값을 반환  
2보다 큰 값은 기존 객체를 재사용하거나 명령어 해석기 내부에서 관리 목적으로 추가 연결된 것을 의미

## 타입 변환
타입 변환은 타입의 의미를 계산 과정에서 변경하는 것  
축소 변환은 변환 후 값이 그대로 유지된느 것을 보장하지 않음  
확정 변환은 변환 후 값이 그대로 유지된는 것을 보장  
일반적으로 정수를 실수로 확장 변환하는 것은 안전하나 실수 표현에 따른 오차가 발생할 수 있다는 점을 유의해야 함  
암시적 변환은 별도 구문없이 파이썬 명령어 해석기가 피연산자의 타입을 탐지해 변환  
명시적 변환은 사용자가 필요에 따라 타입 변환 내장 함수를 적용해 변환  
파이썬은 2가지 나눗셈 연산자를 지원하며 피연산자의 타입에 관계없이 연산자에 따라 정수 또는 실수 결과 반환

In [28]:
5/2

2.5

In [29]:
5//2

2

## 타입 변환 내장 함수
파이썬은 내장 함수를 통해 사용자 타입 변환 지원  
int()는 실수나 "123"과 같이 정수로 변환할 수 있는 문자열을 정수로 변환  
float()는 정수나 "3.14"와 같이 실수로 변환할 수 있는 문자열을 실수로 변환
str()는 대상을 문자열로 변환
list()는 문자열, 튜플, 딕셔너리, 집합을 리스트로 변환  
tuple()은 문자열, 리스트, 딕셔너리, 집합을 튜플로 변환  
dict()는 쌍으로 묶인 튜플 시퀀스를 딕셔너리로 변환  
set()은 문자열, 리스트, 튜플, 딕셔너리를 집합으로 변환

### 정수 타입 변환
내장 함수 int()는 정수로 변환할 수 있는 대상을 정수로 변환 > 실수, 문자열  
실수는 소수점을 제거하는 축소 변환  
문자열은 '0'~'9' 사이 문자열로만 구성된 대상만을 변환

In [30]:
int("123")
int(1.23)

1

### 실수 타입 변환
내장 함순 float()는 실수로 변환할 수 있는 대상을 실수로 변환 > 정수, 문자열  
정수와 실수로 변환 가능한 문자열은 확장 변환에 의해 소수점 0 추가  
round()는 반올림할 자리의 숫자가 0 ~ 4 이면 버리고 6 ~ 9 이면 올림. 5는 앞자리가 짝수면 버리고 홀수로 올림  
math 모듈의 floor() 함수는 대상보다 크지 않은 가장 큰 값으로 변환, ceil() 은 대상보다 작지 않은 가장 작은 값으로 변환

In [32]:
from math import floor, ceil
round(1.5)
round(2.5)
floor(1.75)
ceil(0.17)

1

### 문자열 타입 변환
모든 객체에는 문자열을 반환하는 메소드가 구현되어 있는데 내장 함수 str()은 이를 호출  
내장 함수 chr()과 ord()는 코드 값에 대한 문자를 반환하거나 역으로 문자에 대한 코드 값 반환

In [33]:
str(1234)

'1234'

In [34]:
str((1, 2, 3))

'(1, 2, 3)'

In [35]:
str({1:2, 3:4, 5:6})

'{1: 2, 3: 4, 5: 6}'

In [36]:
chr(0xD55C)

'한'

In [37]:
ord("한")

54620

### 바이트 문자열 타입 변환
문자열 객체의 encode() 메소드는 문자열을 바이트 문자열로 변환  
바이트 문자열 객체의 decode() 메소드는 바이트 문자열을 문자열로 변환

In [39]:
a = """
안녕하세요!
"""
b = a.encode()
c = b"Python"
d = c.decode()
e = bytearray(c) #바이트문자열을 바이트 배열로 변경 , 수정 가능
e[0] = ord('p')

In [44]:
a

'\n안녕하세요!\n'

In [41]:
b #utf기반의 시퀀스

b'\n\xec\x95\x88\xeb\x85\x95\xed\x95\x98\xec\x84\xb8\xec\x9a\x94!\n'

In [42]:
c

b'Python'

In [43]:
d

'Python'

In [40]:
e

bytearray(b'python')

## 타입변환
내장 함수 list()는 문자열, 튜플, 딕셔너리, 집합을 리스트로 변환  
문자열은 각 문자를 분리해 리스트 요소로 변환  
딕셔너리는 키만 변환

In [45]:
a = list("Python")
b = list((1, (2, (3, None))))
c = list({1:2, 3:4, 5:6})
d = list({3, 1, 2, 1, 3})
e = list()

In [46]:
a

['P', 'y', 't', 'h', 'o', 'n']

In [47]:
b

[1, (2, (3, None))]

In [48]:
c

[1, 3, 5]

In [49]:
d

[1, 2, 3]

In [50]:
e

[]

### 튜플 타입 변환
내장 함수 tuple()은 문자열, 리스트, 딕셔너리, 집합을 튜플로 변환  
문자열은 각 문자를 분리해 튜플 요소로 변환  
딕셔너리는 키만 변환

In [51]:
tuple("Hello World") # 각 요소가 튜플의 요소가 됨

('H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd')

In [52]:
tuple([1, [2, [3, None]]])

(1, [2, [3, None]])

In [53]:
tuple({1:2, 3:4, 5:6}) # 키값만 튜플로

(1, 3, 5)

In [56]:
tuple({1, 2, 3, 3, 2, 1}) #중복을 허용하지 않는 집합

(1, 2, 3)

### 딕셔너리 타입 변환
내장 함수 dict()는 쌍으로 묶인 튜플 시퀀스를 딕셔너리로 변환  
기존 객체들을 으로 묶어서 변환할 때, 내장함수 zip() 사용 > 튜플  
내장함수 zip()은 2개의 시퀀스에서 차례로 요소를 하나씩 가져와 튜플 시퀀스로 변환

In [57]:
dict(((1, 2), (3, 4), (5, 6)))

{1: 2, 3: 4, 5: 6}

In [58]:
zip([1, 3, 4], [2, 4, 6])

<zip at 0x2036a5a8f48>

In [59]:
dict(zip([1, 3, 4], [2, 4, 6]))

{1: 2, 3: 4, 4: 6}

In [60]:
zip("python", [[1, 2], [3, 4], [5, 6]])

<zip at 0x2036a5aa448>

In [61]:
dict(zip("python", [[1, 2], [3, 4], [5, 6]]))

{'p': [1, 2], 'y': [3, 4], 't': [5, 6]}

### 집합 타입 변환
내장 함수 set()은 문자열, 리스트, 튜플, 딕셔너리를 집합으로 변환  
집합의 특성상 변환 대상에 포함된 중복 요소 제거  
참조를 포함하거나 연결 구조로 표횐된 리스트와 튜플은 변환 안 됨  
문자열은 각 문자를 분리해 집합 요소로 변환  
딕셔너리는 키만 변환

In [63]:
set([1, 1, 2, 3, 4, 1])

{1, 2, 3, 4}

In [64]:
set("hello")

{'e', 'h', 'l', 'o'}

In [66]:
set[[1, 2], [2, 3]] #참조를 포함하면 오류 발생

TypeError: 'type' object is not subscriptable

In [67]:
set({1:"apple", 2:"banana", 3:"grape"})

{1, 2, 3}