### 데이터 타입

타입은 데이터 값을 변경할 수 있는 변수(가변)인지 혹은 변경할 수 없는 상수(불변)인지 판단한다.<br>
하지만 파이썬은 강타입이기 때문에 타입을 변경할 수 없다.<br>
<br>
**부울**: True 혹은 False <br>
**정수**: 42, 100000과 같은 숫자 <br>
**실수**: 소수점이 있는 숫자(3.2345), 지수(1.0e8: 10의 8승) <br>
**문자열**: 텍스트 문자들의 시퀀스 <br>
<br>
**변수**: 실제 데이터를 참조하는 이름 (컴퓨터 메모리에 있는 값을 참조하기 위한 이름) <br>
**할당 연산자**: 변수에 값을 할당할 때는 `=`를 쓴다. (파이썬 표현식에서는 `=`의 오른쪽을 먼저 계산한 후 왼쪽의 변수에 계산된 값을 할당)<br><br>
파이썬에서는 모든 것이 객체로 구현되어 있다. <br>

In [111]:
a = 7 # 변수 이름 a에 값 7을 할당 (=정수 7이 담긴 객체 박스를 생성한다는 의미)
print(a) # a값을 출력

b = a # a를 b에 할당
print(b)

7
7


In [112]:
# 리터럴 타입의 값
a = 58
b = 99.9
c = 'abc'

# type 내장함수: 변수 혹은 리터럴값의 타입 출력
# class: 객체의 정의 (class와 type의 의미는 같다)
print(type(a))
print(type(b))
print(type(c))

<class 'int'>
<class 'float'>
<class 'str'>


### 변수 이름 규칙
- 소문자(a~z)
- 대문자(A~Z) 
- 숫자(0~9)
- 언더스코어(_) 

이름은 숫자로 시작할 수 없다.<br>
파이썬에서 언더스코어로 시작하는 이름은 특별한 방법으로 처리한다.<br>
파이썬의 **예약어**는 변수이름으로 사용할 수 없다.

### 숫자 (Number)
#### 수학 연산자
- `+`: 더하기 
- `-`: 빼기 
- `*`: 곱하기
- `/`: 부동소수점 나누기
- `//`: 정수 나누기(소수점 이하 버림) - 나머지를 뺀 결과
- `%`: 몫을 뺀 나머지
- `**`: 지수

#### 정수(integer)
: 대화식 인터프리터에서 연속된 숫자는 리터럴 정수로 간주
- 0 사용 가능 → 하지만 0을 다른 숫자 앞에 표기 불가
- 양수 표현
    - 숫자 앞에 기호가 없으면 양수를 의미
    - 숫자 앞에 `+`를 붙임 (e.g. +123)
- 음수 표현: 숫자 앞에 `-` 기호를 붙임
- **형변환**: `int()` (숫자만 변환가능)

In [113]:
# 0으로 나누면 예외 발생
5 / 0

ZeroDivisionError: division by zero

In [114]:
# 정수값이 할당된 변수와 리터럴 변수를 혼합하여 사용 가능
a = 95
print(a - 3)
print(a) # a-3의 결과값을 a에 할당하지 않았으므로 a의 값은 변하지 않는다.

# a값을 바꾸고 싶다면 재할당하면 된다.
a = a - 3 # a -= 3
print(a)

92
95
92


In [115]:
divmod(9, 5) # 몫과 나머지를 동시에 얻는 내장함수

(1, 4)

#### 진수
: 비트단위 연산에서 유용하게 쓰인다.
- 2진수(binary): 0b 혹은 0B
- 8진수(octal): 0o 혹은 0O
- 16진수(hex): 0x 혹은 0X

In [116]:
# 10진수 출력
10

10

In [117]:
# 2진수 10을 10진수로 출력 (2*1)+(1*0) = 2
0b10

2

In [118]:
# 8진수 10을 10진수로 출력 (8*1)+(1*0) = 8
0o10

8

In [119]:
# 16진수 10을 10진수로 출력 (16*1)+(1*0) = 16
0x10

16

In [120]:
# 형변환

print(int(True)) # boolean
print(int(False)) # boolean
print(int(98.6)) # float
print(int('99')) # string
print(int('-23')) 
print(int('+12'))
print(int(1.0e4)) # exponential

1
0
98
99
-23
12
10000


`int()`함수에서 숫자가 아닌 다른 뭔가를 변환하면 예외 발생

In [121]:
int('Hello')

ValueError: invalid literal for int() with base 10: 'Hello'

In [122]:
int('')

ValueError: invalid literal for int() with base 10: ''

`int()`함수는 부동소수점수, 혹은 숫자로 이루어진 문자열을 정수로 반환한다.<br>
그러나 <span style="color: red">소수점 혹은 지수를 포함하는 문자열은 처리하지 않는다.</span>

In [123]:
int('98.5')

ValueError: invalid literal for int() with base 10: '98.5'

In [124]:
int('1.0e4')

ValueError: invalid literal for int() with base 10: '1.0e4'

In [125]:
# 숫자타입을 섞어서 사용하면 파이썬은 자동으로 형변환한다.
4 + 7.0 # int + float = float

11.0

정수 혹은 부동소수점수와 같이 Boolean값을 계산할 때 False는 0 혹은 0.0으로, True는 1 혹은 1.0으로 간주한다.

In [126]:
print(True + 2)
print(False + 5.0)

3
5.0


#### 부동소수점수 (float)
- `+`, `-`, `/`, `//`, `**`, `%` 연산과 `divmod()`함수 사용 가능
- **형변환**: `float()`

In [127]:
# 형변환
print(float(True))
print(float(False))
print(float(98))
print(float('99'))
print(float('98.6'))
print(float('-1.5'))
print(float('1.0e4'))

1.0
0.0
98.0
99.0
98.6
-1.5
10000.0


#### 문자열 (string)
- Sequence 타입 (iterable 객체)
- 불변(immutable) 객체
- `' '`, `" "`, `''' '''`, `""" """`
- **형변환**: `str()`
- 이스케이프 문자: `\n`, `\t`, `\`, `\\`
- `+`: 리터럴 문자열 또는 문자열 변수를 결합
- `*`: 문자열 복제
- 문자 추출: `문자열이름[오프셋]`
- 인덱싱
- 슬라이싱: `문자열객체[start:end:step]` (끝 오프셋은 실제 오프셋 + 1)

#### 문자열을 다루는 메소드
- `len()`: 문자열 길이 (다른 시퀀스타입에서도 사용 가능)
- `'추가할 구분자' + join(문자열객체)`: 문자열 리스트를 하나의 문자열로 결합 <br>

<span style="color: red;">문자열객체 안의 문자열이..</span><br>
- `문자열객체.split('구분자')`: 어떤 문자열을 기준으로 하나의 문자열을 작은 문자열들의 리스트로 나누기
- `문자열객체.replace('바꿀문자열','대체할 새문자열','바꿀문자열에 대한 횟수')`: 문자열 일부를 대체 (대체하고 싶은 문자열이 전체 단어인지, 한 단어의 시작의 일부인지 등의 특수한 조건이 있다면 **정규표현식**을 사용)
- `문자열객체.startswith('문자열')`: '문자열'로 시작하는가? (불린값 반환)
- `문자열객체.endswith('문자열')`: '문자열'로 끝나는가? (불린값 반환)
- `문자열객체.find('문자열')`: 첫번째로 '문자열'이 나오는 오프셋은?
- `문자열객체.rfind('문자열')`: 마지막으로 '문자열'이 나오는 오프셋은?
- `문자열객체.count('문자열')`: '문자열'은 몇번 나오는가?
- `문자열객체.isalnum()`: 문자와 숫자로만 이루어져 있는가? (불린값 반환)
- `문자열객체.strip('삭제할 문자')`: '삭제할 문자'(시퀀스)를 양끝에서 삭제
- `문자열객체.capitalize()`: 첫번째 단어를 대문자화
- `문자열객체.title()`: 모든 단어의 첫 글자를 대문자화
- `문자열객체.upper()`: 모든 글자를 대문자화
- `문자열객체.lower()`: 모든 글자를 소문자화
- `문자열객체.swapcase()`: 대문자는 소문자화, 소문자는 대문자화
- `문자열객체.center(지정한 공간)`: 문자열을 지정한 공간에서 중앙에 배치 (e.g. `setup.center(30)`)
- `문자열객체.ljust(지정한 공간)`: 문자열을 지정한 공간에서 왼쪽에 배치
- `문자열객체.rjust(지정한 공간)`: 문자열을 지정한 공간에서 오른쪽에 배치

In [166]:
# 단일 인용 부호의 문자열을 이중 인용 부호에 넣거나, 이중 인용 부호의 문자열을 단일 인용 부호에 넣을 수 있다.
print("'Nay', said the naysyer.")
print('Hello, my name is "Sejin Kim"')

'Nay', said the naysyer.
Hello, my name is "Sejin Kim"


In [129]:
# 세개의 단일 인용 부호는 여러 줄의 문자열에 사용 (공백 허용: 두번째 줄)
print('''There was a Young Lady of Norway,
        Who casually sat in a doorway; 
When the door squeezed her flat,
She exclaimed, "What of that?"
This courages Young Lady of Norway.''')

There was a Young Lady of Norway,
        Who casually sat in a doorway; 
When the door squeezed her flat,
She exclaimed, "What of that?"
This courages Young Lady of Norway.


In [130]:
# 빈문자열을 이용하면 여러 문자열을 한 문자열로 합칠 때 문자열 사이에 공백을 입력할 수 있어 유용하다.
bottle = 99
base = ''
base += 'current inventory: '
base += str(bottle)

print(base)

current inventory: 99


In [131]:
# 문자열로 형변환
print(str(98.6))
print(str(1.0e4))
print(str(True))

98.6
10000.0
True


#### 이스케이프 문자

In [132]:
# \n: 한줄의 문자열을 여러 줄의 문자열로 바꿀 수 있다.
palindorme = 'A man, \nA plan, \nA canal: \nPanama.'
print(palindorme)

A man, 
A plan, 
A canal: 
Panama.


In [133]:
# \t: 텍스트 공백에 사용
print('\tabc')
print('a\tbc')
print('abc\t')

	abc
a	bc
abc	


In [134]:
# \: 단일 또는 이중부호를 표현 가능
testimony = "\"I did nothing!\" he said. \"Not that either! Or the other thing.\""
print(testimony)

"I did nothing!" he said. "Not that either! Or the other thing."


In [135]:
# \\: 백슬래쉬를 입력하고 싶으면 백슬래쉬를 두번 입력
speech = 'Today we honor our friend, the backslash: \\.'
print(speech)

Today we honor our friend, the backslash: \.


파이썬은 문자열을 결합할 때 공백을 자동으로 붙이지 않는다. 그래서 명시적으로 공백을 넣어주어야 한다.

In [136]:
# 문자열 +연산자로 결합
a = 'Release the kraken! ' + 'At once!'
print(a)

# 리터럴 문자열의 결합
print("My world! " "A gentleman caller!")

Release the kraken! At once!
My world! A gentleman caller!


In [137]:
# 문자열 복제
start = 'Na ' * 4 + '\n'
middle = 'Hey ' * 3 + '\n'
end = 'Goodbye'

print(start + start + middle + end)

Na Na Na Na 
Na Na Na Na 
Hey Hey Hey 
Goodbye


In [138]:
# 문자 추출
letters = 'abcdefghijklmn'

print(letters[0])
print(letters[2])
print(letters[-1])
print(letters[-2])

print(letters[100])

a
c
n
m


IndexError: string index out of range

In [139]:
# 문자열은 불변하기 때문에 특정 인덱스에 문자를 삽입하거나 변경할 수 없다
name = 'Henny'
name[0] = 'P'

print(name)

TypeError: 'str' object does not support item assignment

In [140]:
# replace()로 특정 문자 변환
name = 'Henny'

print(name.replace('H', 'P'))
print(name) # 원본 객체는 변경되지 않는다

Penny
Henny


In [141]:
# 슬라이스로 특정 문자 변환
name = 'Henny'

print('P' + name[1:])

Penny


In [142]:
letters = 'abcdefghijklmnopqrstuvwxyz'

print(letters[:])
print(letters[20:])
print(letters[10:])

print(letters[12:15])
print(letters[-3:])
print(letters[18:-3])
print(letters[-6:-2])

print(letters[4:20:3])
print(letters[19::4])
print(letters[:21:5])

abcdefghijklmnopqrstuvwxyz
uvwxyz
klmnopqrstuvwxyz
mno
xyz
stuvw
uvwx
ehknqt
tx
afkpu


In [144]:
# 문자열 길이 len()
greeting = 'Hello'

print(len(greeting))

5


In [145]:
# 문자열 나누기 split('구분자')
todos = 'get gloves,get mask,gibe cat vitamins,call ambulance'
_todos = todos.split(',')

print(_todos)

['get gloves', 'get mask', 'gibe cat vitamins', 'call ambulance']


In [147]:
# split()함수 사용시 구분자를 지정하지 않으면 문자열에 등장하는 공백문자를 사용
print(todos.split())

['get', 'gloves,get', 'mask,gibe', 'cat', 'vitamins,call', 'ambulance']


In [149]:
# 결합할 문자열을 지정한 다음 문자열 리스트를 결합
crypto_list = ['Yeti', 'Bigfoot', 'Loch Ness Monster']
crypto_string = ', '.join(crypto_list)

print('Found and signing book deals:', crypto_string)

Found and signing book deals: Yeti, Bigfoot, Loch Ness Monster


In [156]:
poem = '''All that doth flow we cannot liquid name
Or else would fire and water be the same;
But that is liquid which is moist and wet
Fire that property can never get.
Then 'tis not cold that doth the fire put out
But 'tis the wet that makes it die, no doubte. '''

print(poem[:13]) # 처음부터 12번째 자 출력
print(len(poem)) # 스페이스와 줄바꿈을 포함하여 이 시의 글자 수
print(poem.startswith('All')) # 이 시는 All로 시작하는가?
print(poem.endswith('That\'s all, folks!')) # 이 시는 That's all, folks!로 끝나는가?

All that doth
252
True
False


In [162]:
word = 'the'
print(poem.find(word)) # 이 시에서 첫 번째로 the가 나오는 오프셋은?
print(poem.rfind(word)) # 이 시에서 마지막으로 the가 나오는 오프셋은?
print(poem.count(word)) # 세글자 the가 몇 번 나오는가?
print(poem.isalnum()) # 이 시는 글자와 숫자로만 이루어져 있는가?

73
214
3
False


In [177]:
# 대소문자와 배치
setup = 'a duck goes into a bar...'

_setup = setup.strip('.')
print(_setup)

setup_capitalize = setup.capitalize()
print(setup_capitalize)

setup_title = setup.title()
print(setup_title)

setup_upper = setup.upper()
print(setup_upper)

setup_lower = setup.lower()
print(setup_lower)

setup_swapcase = setup.swapcase()
print(setup_swapcase)

setup_center = setup.center(30)
print(setup_center)

setup_ljust = setup.ljust(30)
print(setup_ljust)

setup_rjust = setup.rjust(30)
print(setup_rjust)

a duck goes into a bar
A duck goes into a bar...
A Duck Goes Into A Bar...
A DUCK GOES INTO A BAR...
a duck goes into a bar...
A DUCK GOES INTO A BAR...
  a duck goes into a bar...   
a duck goes into a bar...     
     a duck goes into a bar...


In [179]:
# 문자열 대체 replace()
setup = 'a duck goes into a bar...'

_setup = setup.replace('duck', 'marmoset')
print(_setup)

a marmoset goes into a bar...


In [180]:
_setup = setup.replace('a ', 'a famous ', 100)
print(_setup)

a famous duck goes into a famous bar...
