# 자료형
모든 프로그래밍은 결국 데이터를 다루는 행위
- 자료형에 대한 이해는 프로그래밍에서 가장 중요

파이썬의 자료형으로는 정수형, 실수형, 복소수형, 문자열, 리스트, 튜플, 사전 등이 있음
- 필수적으로 알아둬야 함

## 정수형
정수형은 정수를 다루는 자료형
- 양의 정수, 음의 정수, 0이 포함된다.

코딩 테스트에서 출제되는 많은 문제들은 정수형을 주로 다루게 된다.

In [2]:
# 양의 정수
a = 1000
print(a)

# 음의 정수
a = -7
print(a)

# 0 
a = 0
print(a)

1000
-7
0


## 실수형
실수형은 소수점 아래의 데이터를 포함하는 수 자료형
- 파이썬에서는 변수에 소수점을 붙인 수를 대입하면 실수형 변수로 처리된다.
- 소수부가 0이거나, 정수부가 0인 소수는 0을 생략하고 작성할 수 있다.

In [7]:
# 양의 실수
a = 157.93
print(a)

# 음의 실수
a = -1837.2
print(a)

# 소수부가 0일 때 0을 생략
a = 5.
print(a)

# 정수부가 0일 때 0을 생략
a = -.7
print(a)

157.93
-1837.2
5.0
-0.7


지수 표현 방식은 임의의 큰 수를 표현하기 위해 사용되며 실수형으로 처리된다.

최단 경로 알고리즘에서는 도달할 수 없는 노드에 대하여 최단 거리를 **무한(Inf)**로 설정

이 때 가능한 최댓값이 10억 미만이라면 무한(Inf)의 값으로 1e9를 이용할 수 있다.

In [8]:
# 1,000,000,000의 지수 표현 방식 
a = 1e9
print(a)

# 752.5
a = 75.25e1
print(a)

# 3.954
a = 3954e-3
print(a)

1000000000.0
752.5
3.954


가장 널리 쓰이는 IEEE754 표준에서는 실수형을 저장하기 위해 4바이트 또는 8바이트의 고정된 크기의 메모리를 할당하므로, 컴퓨터 시스템은 실수 정보를 표현하는 정확도에 한계를 가진다.
- 예를 들어 10진수 체계에서는 0.2 + 0.7이 정확히 0.9로 떨어지지만 2진수에서는 0.9를 정확히 표현할 방법이 없기 때문에 최대한 0.9에 가깝게 표현하지만 미세한 오차가 발생하게 된다.

In [1]:
0.2+0.7

0.8999999999999999

In [3]:
a = 0.2 + 0.7
print(a)

if a == 0.9 : 
    print(True)
else :
    print(False)

0.8999999999999999
False


개발 과정에서 실수 값을 제대로 비교하지 못해서 원하는 결과를 얻지 못할 수 있다.

이럴 때는 `round()`함수를 이용할 수 있으며, 이 방법이 권장된다.

In [4]:
round(123.456,2)

123.46

In [5]:
a = 0.2 + 0.7
print(round(a, 4)) 

if round(a, 4) == 0.9 :
    print(True)
else :
    print(False)

0.9
True


## 수 자료형의 연산
수 자료형에 대하여 사칙연산과 나머지 연산자가 많이 사용된다.

단, 나누기 연산자(\/)를 주의해서 사용해야 한다.
- 파이썬에서는 나누기 연산자(\/)는 나눠진 결과를 실수형으로 반환

다양한 로직을 설계할 때 나머지 연산자(\%)를 이용해야 하는 경우가 많다.
- ex. a가 홀수인지 아닌지 체크

몫 연산자 : \//
    
이외에도 거듭 제곱 연산자(**)를 비롯해 다양한 연산자 존재

In [8]:
a = 7
b = 3

# 나누기
print(a / b)

# 나머지 ; %% in r
print(a % b)

# 몫 ; %/% in r
print(a // b)

2.3333333333333335
1
2


In [9]:
a = 5 
b = 3 

# 거듭 제곱 
print(a ** b)

# 제곱근
print(a ** .5)

125
2.23606797749979


## 리스트 초기화
리스트는 대괄호 안에 원소를 넣어 초기화, 쉼표로 원소 구분

비어있는 리스트를 선언하고자 할 때는 `list()` 혹은 []

리스트의 원소에 접근할 때는 인덱스 값을 괄호에 넣는다(인덱스는 0부터 시작)

In [10]:
# 직접 데이터를 넣어 초기화
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(a)

# 네 번째 원소만 출력
print(a[3])

# 크기가 N이고, 모든 값이 0인 1차원 리스트 초기화
n = 10
a = [0]*n
print(a)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
4
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]


## 리스트의 인덱싱과 슬라이싱
인덱스 값을 입력하여 리스트의 특정한 원소에 접근하는 것을 인덱싱이라고 한다.
- 파이썬의 인덱스 값은 양의 정수와 음의 정수를 모두 사용할 수 있음
- 음의 정수를 넣으면 원소를 거꾸로 탐색하게 된다.(이 경우는 0이 아니라 1부터 시작)

In [12]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 여덟 번째 원소만 출력
print(a[7])

# 뒤에서 첫 번째 원소 출력
print(a[-1])

# 뒤에서 세 번째 원소 출력
print(a[-3])

# 네 번째 원소 값 변경
a[3] = 7
print(a)

8
9
7
[1, 2, 3, 7, 5, 6, 7, 8, 9]


리스트에서 연속적인 위치를 갖는 원소들을 가져와야 할 때는 슬라이싱 이용
- 대괄호 안에 콜론(:)을 넣어서 시작 인덱스와 끝 인덱스를 설정할 수 있다.
- 끝 인덱스는 실제 인덱스보다 1을 더 크게 설정

In [13]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 네 번째 원소만 출력
print(a[3])

# 두 번째 원소부터 네 번째 원소까지 출력
print(a[1:4])

4
[2, 3, 4]


## 리스트 컴프리헨션(list comprehension)
리스트를 초기화하는 방법 중 하나
- 대괄호 안에 조건문과 반복문을 적용하여 리스트 초기화

In [14]:
array = [i for i in range(10)]

print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [15]:
# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = [i for i in range(20) if i % 2 == 1]
print(array)

# 1부터 9까지의 수들의 제곱값을 포함하는 리스트
array = [i**2 for i in range(10)]
array

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]


[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

### 리스트 컴프리헨션과 일반적인 코드 비교
0부터 19까지의 수 중에서 홀수만 포함하는 리스트

In [20]:
import time

1 : 리스트 컴프리헨션

In [26]:
array = [i for i in range(20) if i%2 == 1]

print(array)

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]


2 : 일반적인 코드

In [27]:
array = []
for i in range(20) :
    if i % 2 == 1 : 
        array.append(i)

print(array)

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]


리스트 컴프리헨션은 2차원 리스트를 초기화할 때 효과적으로 사용될 수 있다.

특히 $N \times M$ 크기의 2차원 리스트를 한 번에 초기화할 때 유용하다.
- ex. array = [[0]*m for _ in range(n)]  (good)

만약 2차원 리스트를 초기화할 때 다음과 같이 작성하면 예기치 않은 결과가 발생할 수 있다.
- ex. array = [[0]*m]*n (bad)
- 위 코드는 전체 리스트 안에 포함된 각 리스트가 모두 같은 객체로 인식된다.

좋은 예시

In [35]:
n = 4
m = 3
array = [[0] * m for _ in range(n)]
print(array)

[[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]


잘못된 예시

In [36]:
n = 4
m = 3 
array = [[0]*m]*n
print(array)

[[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]


In [37]:
array[1][1] = 5
print(array)

[[0, 5, 0], [0, 5, 0], [0, 5, 0], [0, 5, 0]]


2번째 코드의 경우 결과는 제대로 나오지만, 전체 리스트 내의 각 리스트가 같은 참조값을 가지게 된다.

즉, 한 개의 리스트에 변경 사항이 생기면 모든 리스트에 적용된다.

### 반복문에서 언더바(_)의 사용?
파이썬에서는 반복을 수행하되 반복을 위한 변수의 값을 무시하고자 할 때 언더바를 주로 사용한다.

특정 변수에 대한 반복이 아닐 때

코드 1 : 1부터 9까지의 자연수를 모두 더하기

In [38]:
summary = 0 
for i in range(1,10) : 
    summary += i
print(summary)

45


코드 2 : "Hello World"를 5번 출력하기

In [39]:
for _ in range(5) :
    print("Hello World")

Hello World
Hello World
Hello World
Hello World
Hello World


## 리스트 관련 기타 메서드

![image-2.png](attachment:image-2.png)

In [41]:
a = [1, 4, 3]
print("기본 리스트 : ", a)

# 리스트에 원소 삽입 
a.append(2)
print("삽입 : ", a)

# 오름차순 정렬
a.sort()
print("오름차순 정렬 : ", a)

# 내림치순 정렬
a.sort(reverse = True)
print("내림차순 정렬 : ", a)

# 리스트 원소 뒤집기 
a.reverse()
print('원소 뒤집기 : ', a)

# 특정 인덱스에 데이터 추가
a.insert(2, 3)
print('인덱스 2에 3 추가 : ', a)

# 특정 값을 만족하는 데이터 개수 세기
print('값이 3인 데이터 개수 : ', a.count(3))

# 특정 값 데이터 삭제
a.remove(1)
print('값이 1인 데이터 삭제 : ', a)

기본 리스트 :  [1, 4, 3]
삽입 :  [1, 4, 3, 2]
오름차순 정렬 :  [1, 2, 3, 4]
내림차순 정렬 :  [4, 3, 2, 1]
원소 뒤집기 :  [1, 2, 3, 4]
인덱스 2에 3 추가 :  [1, 2, 3, 3, 4]
값이 3인 데이터 개수 :  2
값이 1인 데이터 삭제 :  [2, 3, 3, 4]


In [45]:
# 리스트에서 특정 값을 가지는 원소 모두 제거하기
a = [1,2,3,4,5,5,5]
remove_set = {3, 5} # 집합 자료형

# remove_set에 포함되지 않은 값만을 지정
result = [i for i in a if i not in remove_set]
print(result)

[1, 2, 4]
