# Data Types
값의 종류와 그 값에 적용 가능한 연산과 동작을 결정하는 속성  
-> 사칙연산, 연결이 가능한지 데이터 타입에 따라 달라진다.

데이터 타입이 필요한 이유
---
- 값들을 구분하고, 어떻게 다뤄야 하는지를 알 수 있음
- 요리 재료마다 특정한 도구가 필요하듯이 각 데이터 타입 값들도 각자에게 적합한 도구를 가짐
- 타입을 명시적으로 지정하면 코드를 읽는 사람이 변수의 의도를 더 쉽게 이해할 수 있고, 잘못된 데이터 타입으로 인한 오류를 미리 예방

### 데이터 타입 분류
- Numeric Types
    - int (정수), float (실수), complex (복소수)
- Text Sequence Type
    - str (문자열)
- Sequence Types
    - list, tuple, range
- Non-sequence Types
    -  set, dict
- 기타
    - Boolean, None, Functions

###
- 일반 자료형 // 불변형
- 컨테이너형 : 여러 개 값을 넣을 수 있는 타입(가변/불변)

## Numeric Types
### int (정수형)
- 정수를 표현하는 자료형

진수 표현
- 2진수(binary) : 0b
- 8진수(octal) : 0o
- 16진수(hexadecimal) :0x

In [None]:
# 진법 변경 : 10진수 -> n 진수
print(bin(12)) # 2진수 0b1100
print(oct(12)) # 8진수 0o14
print(hex(12)) # 16진수 0xc

In [None]:
print(0b10) # 2
print(0o30) # 24
print(0x10) # 26

### float (실수자료형)
- 실수를 표현하는 자료형
- 프로그래밍 언어에서 float는 실수에 대한 **근삿값**

유한 정밀도
- 컴퓨터 메모리 용령이 한정되어 있고 한 숫자에 대해 저장하는 용량이 제한 됨

In [None]:
print(2 / 3) # 0.6666666666666666
print(5 / 3) # 1.6666666666666667

실수 연산 시 주의사항
- 컴퓨터는 2진수 사용, 사람은 10진법을 사용
- 10진수 0.1은 2진수 표현시 무한 반복
- 무한대 숫자를 그대로 저장할 수 없어서 사람이 사용하는 10진법의 근사값만 표시
- 0.1의 경우 0.1에 가깝지만 정확이 동일하지 않아 **예상치 못한 결과가 나타남**
- Floating point rounding error (부동소수점에러)

실수 연산 시 해결책
- 두 수의 차이가 매우 작은 수보다 작은지 확인하거나 math 모듈 확인

In [None]:
a = 3.2 - 3.1 # 0.1000000
b = 1.2 - 1.1 # 0.0999999

# 1. 임의의 작은 수 활용
print(abs(a-b) <= 1e-10) # True

# 2. math 모듈 활용 : 이 정도면 같은 수로 치자!
import math
print(math.isclose(a,b)) # True

지수 표현 방식
- e 또는 E 활용

In [None]:
# 지수(제곱하는 횟수) 표현 10^
print(314e-2) # 3.14
print(314E2) # 31400.0

## Sequence Types
여러 개의 값들을 **순서대로 나열**하여 저장하는 자료형
(str, list, tuple, range)

Sequence Types 특징 - 매우 중요 !
1. 순서(Sequece)
- 값들이 순서대로 저장 **(정렬 X)**
2. 인덱싱(indexing)
- 각 값에 고유한 인데스(번호)를 가지고 있으며, 인덱스를 사용하여 특정 위치의 값을 선택하거나 수정할 수 있음  
-> 접근할 수 있다!
3. 슬라이싱(Slicing)
- 인덱스 범위를 조절해 부분적인 값을 추출할 수 있음
4. 길이(Length)
- len() 함수를 사용하여 저장된 값의 개수(길이)를 구할 수 있음
5. 반복(Iteration)
- 반복문을 사용하여 저장된 값들을 반복적으로 처리할 수 있음

### str(문자열)
문자들의 순서가 있는 변경 불가능한 시퀀스 자료형 (불변형 자료형)

문자열 표현
- 문자열은 단일 문자나 여러 문자의 조합으로 이루어짐
- 작은 따옴표 또는 큰따옴표 감싸서 표현

중첩 따옴표
- 따옴표 안에 따옴표를 표현할 경우
- " '' " or ' "" '

Escape sequence
- 역슬래시(backslash)뒤에 특정 문자가 와서 특수한 기능을 하는 문자 조합
- 파이썬의 일반적인 문번규칙을 잠시 탈출한다는 의미  
\n : 줄바꿈  
\t : 탭  
\\ : 백슬래시  
\' : 작은 따옴표  
\" : 큰 따옴표  

In [None]:
# 철수야 '안녕'
print('철수야 \'안녕\'')

String Interpolation
- 문자열 내에 변수나 표현식을 삽입하는 방법

f-string
- 문자열에 f 또는 F 접두어를 붙이고 표현식을 **{expression}**로 작성하여 문자열에 파이썬 표현식의 값을 삽입할 수 있음

In [10]:
# 고정 출력
print('Debugging roaches 13 room')

# f-string
bugs = 'roaches'
counts = 100
area = 'living room'
print(f'Debugging {bugs} {counts} {area}')

Debugging roaches 13 room
Debugging roaches 100 living room


In [11]:
# 과거의 문법 : format과 %
print('Debugging {} {} {}'.format(bugs, counts, area))
print('Debugging %s %d %s' % (bugs, counts, area))

Debugging roaches 100 living room
Debugging roaches 100 living room


In [15]:
# f- string 응용
greeting = 'hi'
print(f'{greeting:>10}') # 10칸 중 오른쪽 정렬
print(f'{greeting:^10}') # 10칸 중 가운데 정렬

print(f'{3.141592:.4f}') # 소수점 4자리까지 출력

        hi
    hi    
3.1416


문자열의 시퀀스 특징
인덱스(index)
시퀀스 내의 값들에 대한 고유한 번호로, 각 값의 위치를 식별하는 데 사용되는 숫자
#### index 예시
![image.png](attachment:image.png)

슬라이싱(slicing)
시퀀스의 일부분을 선택하여 추출하는 작업  
-> 시작 인덱스와 끝 인덱스를 지정하여 해당 범위의 값을 포함하는 새로운 시퀀스를 생성
- 생략, step 지정 등 다양한 기능  
ex) my_str[3:] , my_str[0:5:2]

- step이 음수인 경우 문자열 뒤집기 가능
ex) my_str -> olleh

In [None]:
my_str = 'hello'

# 인덱싱
print(my_str[1]) # e

# 슬라이싱
print(my_str[2:4]) # ll

# 길이
print(len(my_str)) # 5

In [None]:
print(my_str[::-1]) # olleh

문자열은 불변! (변경불가) -> 새로운 문자열 생성

In [None]:
my_str = 'hello'
my_str[1] = 'z' # Typer error

### list(리스트)
여러 개의 값을 순서대로 저장하는 **변경 가능한** 시퀀스 자료형

리스트 표현
- 0개 이상의 객체를 포함하며 데이터 목록을 저장
- 대괄호([])로 표기
- 데이터는 어던 자료형도 저장할 수 있음

중첩된 리스트 접근

리스트는 가변 (변경 가능)

In [None]:
my_list = [1,'a', 3,' b', 5]

# 인덱싱
print(my_list[1]) # a

# 슬라이싱
print(my_list[2:4]) # [3, ' b']
print(my_list[0:5:2]) # [1, 3, 5]

In [None]:
my_list = [1, 2, 3, 'python', ['hello','world','!!']]

print(len(my_list)) # 5
print(my_list[4][-1]) # !!
print(my_list[-1][1][0]) # w

In [18]:
my_list = [1, 2, 3]
my_list[0] = 0
print(my_list)

[0, 2, 3]


### tuple(튜플)
여러 개의 값을 순서대로 저장하는 **변경 불가능한** 시퀀스 자료형

- 0개 이상의 객체를 포함하며 데이터 목록을 저장
- 소괄호(())로 표기
- 데이터는 어떤 자료형도 저장할 수 있음

튜플의 어디에 사용되는가?
- 파이썬의 내부 동작에서 주로 사용됨
- 안전하게 여러 개의 값을 전달, 그룹화, 다중 할당 등

In [None]:
my_tuple_1 = ()
my_tuple_2 = (1, ) # 이렇게 표현하지 않으면 연산시 ()로 취급
my_tuple_3 = (1,'a', 3,' b', 5)

튜플은 불변(변경 불가)

In [None]:
my_tuple = (1,'a', 3,' b', 5)
my_tuple[0] = 0 # Type error

### range
연속된 정수 시퀀스를 생성하는 **변경 불가능**한 자료형

range 표현
range(n)
- 0부터 n-1가지의 숫자의 시퀀스
range(n, m)
- n부터 m-1까지의 숫자 시퀀스
- 주로 반복문과 함께 사용 예정

In [20]:
my_range_1 = range(5)
my_range_2 = range(1, 10)

print(my_range_1)
print(my_range_2)

range(0, 5)
range(1, 10)


리스트로 형 변환 시 데이터 확인 가능

In [21]:
print(list(my_range_1))
print(list(my_range_2))

[0, 1, 2, 3, 4]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


## none sequence types
### dict(딕셔너리)
key-value 쌍으로 이루어진 순서와 중복이 없는 별경 가능한 자료형

딕셔너리 표현
- key는 변경 불가능한 자료형만 사용 가능(str, int, float, tuple, range)
- value는 모든 자료형 사용 가능
- 중괄호({})로 표기

딕셔너리 사용
- key를 통해 value에 접근

In [None]:
my_dict_1 = {}
my_dict_2 = {'key' : 'value'}

In [None]:
my_dict = {'apple': 12, 'list':[1, 2, 3]}

print(my_dict['apple'])
print(my_dict['list'])

# 값 변경
my_dict['apple'] = 100
print(my_dict)

### set(세트)
**순서와 중복**이 없는 변경 가능한 자료형

세트 표현
- 수학에서의 집합과 동일한 연산 처리 가능
- 중괄호로 표기({})

In [22]:
my_set_1 = set()
my_set_2 = {1, 2, 3}
my_set_3 = {1, 1, 1}

print(my_set_1)
print(my_set_2)
print(my_set_3)

set()
{1, 2, 3}
{1}


In [23]:
# 세트의 집합연산
my_set_1 = {1, 2, 3}
my_set_2 = {3, 6, 9}

# 합집합
print(my_set_1 | my_set_2)
# 차집합
print(my_set_1 - my_set_2)
# 교칩합
print(my_set_1 & my_set_2)

{1, 2, 3, 6, 9}
{1, 2}
{3}


## Other Types
### None
파이썬에서 '값이 없음'을 표현하는 자료형

In [24]:
variable = None
print(variable)

None


### Boolean
참과 거짓을 표현하는 자료현

불리언 표현
- 비교/논리 연산의 평가 결과로 사용됨
- 주로 조건/반복문과 함께 사용


# Collection
여러 개의 항목 또는 요소를 담는 자료 구조
str, list, tuple, set, dict

![image.png](attachment:image.png)

In [None]:
# 불변과 가변
my_str = 'hello'
my_str[0] = 'z'

my_list = [1, 2, 3]
my_list[0] = 100
print(my_list)

![image.png](attachment:image.png)

변경 가능 -> 객체들의 참조들의 모아놓은 컬렉션

In [26]:
# 가변형
list_1 = [1, 2, 3]
list_2 = list_1

list_1[0] = 100
print(list_1) # [100, 2, 3]
print(list_2) # [100, 2, 3]

[100, 2, 3]
[100, 2, 3]


![image.png](attachment:image.png)  
list_1과 list_2가 같은 주소를 할당해서 list_1 값을 변경함에 따라 list_2 값이 변경된다! (같은 주소라서!)

In [28]:
# 불변형
x = 10
y = x
x = 20

print(x)
print(y)

20
10


![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

In [None]:
print( 3 + 5.0) # 8.0
print(True + 3) # 4
print( True + False) # 1

# Type Conversion
데이터 값
자료형(a) -> 자료형(b)

## 암시적 형변환 (자연스럽게 변환)
파이썬이 자동으로 형변환을 하는 것
- Boolean과 Numeric Type에서만 가능

## 명시적 형변환
개발자가 직접 형변환을 하는 것
암시적 형변환이 아닌 경우를 모두 포함

str -> integer : 형식에 맞는 숫자만 가능
integer -> str : 모두 가능

In [None]:
print(int('1'))
print(str(1) + '등')
print(int('3.5')) # Type error

## 복합 연산자
```
+=  -> a = a + b
-=  -> a = a - b
*=  -> a = a * b
/=  -> a = a / b
//=  -> a = a // b
%=  -> a = a % b
**=  -> a = a ** b
```

## 비교 연산
```<    미만  
<=      이하  
\>      초과  
\>=     이상
==      같음
!=      같지 않음
is      같음 (원본)
is not  같지 않음
```

is 비교 연산자  
- 메모리 내에서 같은 객체를 참조하는지 확인  

== : 동등성(equality)  
is : 식별성(identity)  

In [None]:
print(2.0 == 2) # True
print(2.0 is 2) # False

## 논리연산자
and 논리곱 모두 True
or 논리합 하나라도 True
not 논리부정 단일 피연산자를 부정

## 단축 평가 : 🌟🌟🌟🌟🌟🌟
논리 연산에서 두 번째 피연산자를 평가하지 않고 결과를 결정하는 동작
- or 문제에서 선제 조건 참일시 하행조건 실행되지 않음
- and 문제에서 선제조건 거짓일시 하행조건 실행되지 않음

이유
- 코드 실행의 최적화, 불필요한 연산을 피할 수 있도록

In [None]:
vowels = 'aeiou'
print(('a' and 'b') in vowels) 
# False : a가 조건에 부합하여 b까지 진행 🌟
print(('b' and 'a') in vowels) 
# True : b가 조건에 부합하지 않아서 🌟

print(3 and 5) # 5
print(3 and 0) # 0
print(0 and 3) # 0
print(0 and 0) # 0

print(5 or 3) # 5
print(3 or 0) # 3
print(0 or 3) # 3
print(0 or 0) # 0

print(3 and 0 and 2) # 0

In [None]:
word = 'hello'
numbers = [1, 2, 3, 4, 5]

print('h' in word) # True
print('z' in word) # False

print(4 not in numbers) # False
print(6 not in numbers) # True

## 멤버십 연산자
특정 값이 시퀀스나 다른 컬렉션에 속하는 지 여부를 확인   
in / not in 

## 시퀀스형 연산자
+와 *는 시퀀스 간 연산에서 산술 연산자일때와 다른 역할을 가짐  

\+ : 결합 연산자  
\* : 반복 연산자  

## 연산자 우선순위
![image.png](attachment:image.png) 