# 자료형

## 정수형
- 정수형(Integer)은 정수를 다루는 자료형
    - 양의 정수, 음의 정수, 0

In [1]:
# 양의 정수
a = 1000
print(a)

# 음의 정수
a = -7
print(a)

# 0
a = 0
print(a)

1000
-7
0


## 실수형
- 실수형(Real Number)은 소수점 아래의 데이터를 포함하는 수 자료형이다.
    - 파이썬에서는 변수에 소수점을 붙인 수를 대입하면 실수형 변수로 처리된다.
    - 소수부가 0이거나, 정수부가 0인 소수는 0을 생략하고 작성할 수 있다.

In [2]:
# 양의 실수
a = 157.93
print(a)

# 음의 실수
a = -1837.2
print(a)

# 소수부가 0일 때 0을 생략
a = 5.
print(a)

# 정수부가 0일 때 0을 생략
a = -.7
print(a)

157.93
-1837.2
5.0
-0.7


### 실수형 더 알아보기
- 오늘날 가장 널리 쓰이는 `IEEE754` 표준에서는 실수형을 저장하기 위해 4바이트, 혹은 8바이트의 고정된 크기의 메모리를 할당하므로, <br> **컴퓨터 시스템은 실수 정보를 표현하는 정확도에 한계를 가진다.**
- 예를 들어 10진수 체계에서는 0.3과 0.6을 더한 값이 0.9로 정확히 떨어진다.
    - 하지만 2진수에서는 0.9를 정확히 표현할 수 있는 방법이 없다.
    - 컴퓨터는 최대한 0.9와 가깝게 표현하지만, 미세한 오차가 발생하게 된다.

In [4]:
a = 0.3 + 0.6
print(a)

if a == 0.9:
    print(True)
else:
    print(False)

0.8999999999999999
False


- 개발 과정에서 실수 값을 제대로 비교하지 못해서 원하는 결과를 얻지 못할 수도 있다.
- 이러 때는 `round()` 함수를 이용할 수 있으며, 이러한 방법이 권장된다.
- 예를 들어 123.456을 소수 셋째 자리에서 반올림하려면 `round(123.456, 2)`라고 작성한다. ⇒ 123.46 출력

In [5]:
a = 0.3 + 0.6
print(a)

if round(a, 4) == 0.9:
    print(True)
else:
    print(False)

0.8999999999999999
True


## 지수 표현 방식
- 파이썬에서는 `e`나 `E`를 이용한 지수 표현 방식을 이용할 수 있다.
    - `e`나 `E` 다음에 오는 수는 10의 지수부를 의미한다.
    - 예를 들어 `1e9`라고 입력하게 되면, 10의 9제곱(1,000,000,000)이 된다.
- 지수 표현 방식은 임의의 큰 수를 표현하기 위해 자주 사용된다.
- 최단 경로 알고리즘에서는 도달할 수 없는 노드에 대하여 최단 거리를 **무한(INF)** 로 설정하곤 한다.
- 이때 가능한 최댓값이 10억 미만이라면 무한(INF)의 값으로 `1e9`를 이용할 수 있다.

In [3]:
# 1,000,000,000의 지수 표현 방식
a = 1e9
print(a)

#752.5
a = 75.25e1
print(a)

#3.954
a = 3954e-3
print(a)

1000000000.0
752.5
3.954


## 수 자료형의 연산
- 수 자료형에 대하여 사칙연산과 나머지 연산자가 많이 사용된다.
- 단 나누기 연산자(`/`)를 주의해서 사용해야한다.
    - 파이썬에서 나누기 연산자(`/`)는 나눠진 결과를 실수형으로 반환한다.
- 다양한 로직을 설계할 때 나머지 연산자(`%`)를 이용해야 할 때가 많다.
- 파이썬에서는 몫을 얻기 위해 몫 연산자(`//`)를 사용한다.
- 이외에도 거듭 제곱 연산자(`**`)를 비롯해 다양한 연산자들이 존재한다.

In [6]:
a = 7
b = 3

# 나누기
print(a / b)

# 나머지
print(a % b)

# 몫
print(a // b)

# 거듭 제곱
print(a ** b)

# 제곱근
print(a ** 0.5)

2.3333333333333335
1
2
343
2.6457513110645907


## 리스트 자료형
- 여러 개의 데이터를 연속적으로 담아 처리하기 위해 사용하는 자료형이다.
    - 사용자 입장에서 자바의 배열(Array)의 기능 및 연결 리스트(ArrayList)와 유사한 기능을 지원한다.
    - 리스트 대신에 배열 혹은 테이블이라고 부르기도 한다.
    <br>
    
        |7|1|5|3|2|6|7|5|
        |--|--|--|--|--|--|--|--|

- 리스트는 대괄호(`[]`) 안에 원소를 넣어 초기화하며, 쉼표(`,`)로 원소를 구분한다.
- 비어 있는 리스트를 선언하고자 할 때는 list()혹은 간단히 `[]`를 이용할 수 있다.
- 리스트의 원소에 접근할 때는 인덱스(Index) 값을 괄호에 넣는다.
    - 인덱스는 0부터 시작한다.

In [10]:
# 직접 데이터를 넣어 초기화
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(a)

# 네 번째 원소만 출력
print(a[3])

# 크기가 N이고, 모든 값이 0인 1차원 리스트 초기화
n = 10
a = [0] * n
print(a)

# 특정 인덱스 값 바꾸기
a = [7, 3, 2, 5, 9]
#    0  1  2  3  4
print(a)

a[4] = 4
print(a)

[1, 2, 3, 4, 5, 6, 7, 8, 9]
4
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
[7, 3, 2, 5, 9]
[7, 3, 2, 5, 4]


### 리스트의 인덱싱과 슬라이싱
- 인덱스 값을 입력하여 리스트의 특정한 원소에 접근하는 것을 인덱싱(Indexing)이라고 한다.
    - 파이썬의 인덱스 값은 양의 정수와 음의 정수를 모두 사용할 수 있다.
    - 음의 정수를 넣으면 원소를 거꾸로 탐색하게 된다.

In [11]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 여덟 번째 원소만 출력
print(a[7])

# 뒤에서 첫 번째 원소 출력
print(a[-1])

# 뒤에서 세 번째 원소 출력
print(a[-3])

# 네 번째 원소 값 변경
a[3] = 7
print(a)

8
9
7
[1, 2, 3, 7, 5, 6, 7, 8, 9]


- 리스트에서 연속적인 위치를 갖는 원소들을 가져와야 할 때는 슬라이싱(Slicing)을 이용한다.
    - 대괄호 안에 콜론(`:`)을 넣어서 **시작 인덱스** 와 **끝 인덱스** 를 설정할 수 있다.
    - **끝 인덱스는 실제 인덱스보다 1을 더 크게 설정한다.**

In [12]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# 네 번째 원소만 출력
print(a[3])

# 두 번째 원소부터 네 번째 원소까지
print(a[1:4])

4
[2, 3, 4]


### 리스트 컴프리헨션
- 리스트를 초기화하는 방법 중 하나이다.
    - **대괄호 안에 조건문과 반복문을 적용하여 리스트를 초기화 할 수 있다.**

In [14]:
# 0부터 9까지의 수를 포함하는 리스트
array = [i for i in range(10)]
print(array)

# 0부터 19까지의 수 중에서 홀수만 포함하는 리스트
array = [i for i in range(20) if i % 2 == 1]
print(array)

# 1부터 9까지의 수들의 제곱 값을 포함하는 리스트
array = [i * i for i in range(1, 10)]
print(array)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]
[1, 4, 9, 16, 25, 36, 49, 64, 81]


- 리스트 컴프리헨션은 2차원 리스트를 초기화할 때 효과적으로 사용된다.
- 특히 N * M 크기의 2차원 리스트를 한 번에 초기화 해야 할 때 매우 유용하다.
    - 좋은 예시 : `array = [[0] * m for _ in range(n)]`
    - 잘못된 예시 : `array = [[0] * m] * n`
    ⇒ 전체 리스트 안에 포함된 각 리스트가 모두 같은 객체로 인식되어 같은 주소값을 가지게 된다. 즉, 하나의 값만 바뀌어도 다 바뀌게 된다.

In [17]:
# 좋은 예시
# N X M 크기의 2차원 리스트 초기화
n = 4
m = 3
array = [[0] * m for _ in range(n)]
print(array)

array[1][1] = 5
print(array)

[[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]
[[0, 0, 0], [0, 5, 0], [0, 0, 0], [0, 0, 0]]


In [15]:
# 잘못된 예시
# N X M 크기의 2차원 리스트 초기화 (잘못된 방법)
n = 4
m = 3
array = [[0] * m] * n
print(array)

array[1][1] = 5
print(array)

[[0, 0, 0], [0, 0, 0], [0, 0, 0], [0, 0, 0]]
[[0, 5, 0], [0, 5, 0], [0, 5, 0], [0, 5, 0]]


### 리스트 관련 기타 메서드
|함수명|사용법|설명|시간 복잡도|
|--|--|--|--|
|append()|번수명.append()|리스트에 원소를 하나 삽입할 때 사용. 가장 뒤에 삽입된다.|O(1)|
|sort()|변수명.sort()<br>변수명.sort(reverse=True)|기본 정렬 기능으로 오름차순으로 정렬<br>내림차순으로 정렬|O(NlogN)|
|reverse()|변수명.reverse()|리스트의 원소의 순서를 모두 뒤집어 놓는다.|O(N)|
|insert()|insert(삽입할 위치 인덱스, 삽입할 값)|특정한 인덱스 위치에 원소를 삽입할 때 사용|O(N)|
|count()|변수명.count(특정값)|리스트에서 특정한 값을 가지는 데이터의 개수를 셀 때 사용|O(N)|
|remove()|변수명.remove(특정값)|특정한 값을 갖는 원소를 제거하는데, 값을 가진 원소가 여러 개면 하나만 제거한다.|O(N)|

In [21]:
a = [1, 4, 3]
print("기본 리스트 : ", a)

# 리스트에 원소 삽입
a.append(2)
print("삽입 : ", a)

# 오름차순 정렬
a.sort()
print("오름차순 정렬 : ", a)

# 내림차순 정렬
a.sort(reverse = True)
print("내림차순 정렬 : ", a)

# 리스트 원소 뒤집기
a.reverse()
print("원소 뒤집기 : ", a)

# 특정 인덱스에 데이터 추가
a.insert(2, 3)
print("인덱스 2에 3 추가 : ", a)
             
# 특정 값인 데이터 개수 세기
print("값이 3인 데이터 개수 : ", a.count(3))

기본 리스트 :  [1, 4, 3]
삽입 :  [1, 4, 3, 2]
오름차순 정렬 :  [1, 2, 3, 4]
내림차순 정렬 :  [4, 3, 2, 1]
원소 뒤집기 :  [1, 2, 3, 4]
인덱스 2에 3 추가 :  [1, 2, 3, 3, 4]
값이 3인 데이터 개수 :  2


In [22]:
a = [1, 2, 3, 4, 5, 5, 5]
print("원본 리스트 : ", a)
# 특정 값 데이터 삭제
a.remove(1)
print("값이 1인 데이터 삭제 : ", a)

# 리스트에서 특정 값을 가지는 원소 모두 제거하기
remove_set = {3, 5} # 집합 자료형

#remove_set에 포함되지 않은 값만을 저장
result = [i for i in a if i not in remove_set]
print(result)

원본 리스트 :  [1, 2, 3, 4, 5, 5, 5]
값이 1인 데이터 삭제 :  [2, 3, 4, 5, 5, 5]
[2, 4]


## 언더바(`_`) 사용 예시
- 파이썬에서는 반복을 수행하되 반복을 위한 변수의 값을 무시하고자 할 때 언더바(`_`)를 자주 사용한다.

In [19]:
# 1부터 9까지의 자연수를 더하기
summary = 0
for i in range(1, 10):
    summary += i
print(summary)

# "Hello World"를 5번 출력하기
for _ in range(5):
    print("Hello World")

45
Hello World
Hello World
Hello World
Hello World
Hello World


## 문자열 자료형
- 문자열 변수를 초기화할 때는 큰따옴표(`"`)나 작은 따옴표(`'`)를 이용한다.
- 문자열 안에 큰따옴표나 작은 따옴표가 포함되어야 하는 경우가 있다.
    - 전체 문자열을 큰따옴표로 구성하는 경우, 내부적으로 작은 따옴표를 포함할 수 있다.
    - 전체 문자열을 작은따옴표로 구성하는 경우, 내부적으로 큰따옴표를 포함할 수 있다.
    - 혹은 백슬래시(`\`)를 사용하면, 큰따옴표나 작은 따옴표를 원하는 만큼 포함시킬 수 있다.

In [23]:
data = 'Hello World'
print(data)

data = "Don't you know \"Python\"?"
print(data)

Hello World
Don't you know "Python"?


### 문자열 연산
- 문자열 변수에 **덧셈(`+`)** 을 이용하면 **문자열이 더해져서 연결(Concatenate)** 된다.
- 문자열 변수를 특정한 양의 정수와 곱하는 경우, 문자열이 그 값만큼 여러 번 더해진다.
- 문자열에 대해서도 마찬가지로 인덱싱과 슬라이싱을 이용할 수 있다.
    - 다만 문자열은 특정 인덱스의 값을 변경할 수는 없다.(Immutable)

In [24]:
a = "Hello"
b = "World"
print(a + " " + b)
# a[2] = "A" -- Error. 특정 인덱스만 변경 불가능

a = "String"
print(a * 3)

a = "ABCDEF"
print(a[2:4])

Hello World
StringStringString
CD


## 튜플 자료형
- 튜플 자료형은 리스트와 유사하지만 문법적 차이가 있다.
    - 튜플은 한 번 선언된 값을 변경할 수 없다.
    - 리스트는 대괄호(`[]`)를 이용하지만, 튜플은 소괄호(`()`)를 이용한다.
- 튜플은 리스트에 비해 상대적으로 공간 효율적이다.(리스트를 사용할 때보다 더 적은 양의 메모리를 사용한다.)

In [25]:
a = (1, 2, 3, 4, 5, 6, 7, 8, 9)

# 네 번째 원소만 출력
print(a[3])

# 두 번째 원소부터 네 번째 원소까지
print(a[1:4])

# a[2] = 7  -- Error. 변경 불가능

4
(2, 3, 4)


### 튜플을 사용하면 좋은 경우
- **서로 다른 성질** 의 데이터를 묶어서 관리해야 할 때
    - 최단 경로 알고리즘에서는(비용, 노드 번호)의 형태로 튜플 자료형을 자주 사용한다.
- 데이터의 나열을 **해싱(Hashing)의 키 값** 으로 사용해야 할 때
    - 튜플은 변경이 불가능하므로 리스트와 다르게 키 값으로 사용될 수 있다.
- 리스트보다 **메모리를 효율적으로 사용** 해야 할 때

## 사전 자료형
- 사전 자료형은 **키(Key)와 값(Value)의 쌍을 데이터로 가지는 자료형** 이다.
    - 앞서 다루었던 리스트나 튜플이 값을 순차적으로 저장하는 것과는 대비된다.
- 사전 자료형은 키와 값의 쌍을 데이터로 가지며, 원하는 **'변경 불가능한(Immutable) 자료형'** 을 키로 사용할 수 있다.
- 파이썬의 사전 자료형은 해시 테이블(Hash Table)을 이용하므로 <U>데이터의 조회 및 수정에 있어서 `O(1)`의 시간에 처리</U> 할 수 있다.

In [26]:
data = dict() # 사전 자료형 초기화
data['사과'] = 'Apple'
data['바나나'] = 'Banana'
data['코코넛'] = 'Coconut'

print(data)

if '사과' in data:
    print('사과를 키로 가지는 데이터가 존재한다.')

{'사과': 'Apple', '바나나': 'Banana', '코코넛': 'Coconut'}
사과를 키로 가지는 데이터가 존재한다.
