# 문자열 다루기

In [1]:
word = 'grail'
sent = 'a scratch'

## 인덱스 슬라이딩

In [2]:
# 인덱스로 문자열 추출
word[0]

'g'

In [3]:
sent[0]

'a'

In [4]:
word[0:3]

'gra'

In [5]:
sent[-1]

'h'

In [6]:
sent[-9:-8]

'a'

In [8]:
sent[0:-8]

'a'

In [9]:
# 전체 문자열을 추출할 때는 음수를 사용하지 않는다
sent[2:-1]

'scratc'

In [10]:
sent[-7:-1]

'scratc'

In [11]:
s_len = len(sent)
sent[2:s_len]

'scratch'

In [12]:
word[0:3]

'gra'

In [15]:
word[:3]

'gra'

In [16]:
word[0:3]

'gra'

In [17]:
# 문자열을 처음부터 3-1 까지
word[ :3]

'gra'

In [18]:
sent[2:len(sent)]

'scratch'

In [19]:
# 문자열을 index 2부터 끝까지
sent[2:]

'scratch'

In [20]:
# 문자열 전체
sent[:]

'a scratch'

In [21]:
# 문자열을 일정 간격으로 추출
sent[::2]

'asrth'

## 문자열 메서드

- capitalize: 첫 문자를 대문자로
- count: 문자열 개수 반환
- startswith: 문자열이 특정 문자로 시작하면 True
- endwith: 문자열이 특정 문자로 끝나면 True
- find: 찾을 문자열의 첫 번째 인덱스를 반환. 실패시 -1
- index: find 메서드와 같은 역할을 수행하지만 실패시 ValueError
- isalpha: 모든 문자가 알파벳이면 True
- isdecimal: 모든 문자가 숫자면 True
- isalnum: 모든 문자가 알파벳이거나 숫자면 True
- lower: 모든 문자를 소문자로 변환
- upper: 모든 문자를 대문자로 변환
- replace: 문자열의 문자를 다른 문자로 교체
- strip: 문자열의 맨 앞과 맨 뒤에 있는 빈 칸을 제거
- split: 구분자를 지정하여 문자열을 나누고, 나눈 값들의 리스트를 반환
- partition: split 메서드와 비슷한 역할을 수행하지만 구분자도 반환
- center: 지정한 너비로 문자열을 늘이고 문자열을 가운데로 정렬
- zfill: 문자열의 빈칸을 '0'로 채운다.

In [23]:
'black Knight'.capitalize()

'Black knight'

In [24]:
"It's just a flesh wound!".count('u')

2

In [25]:
"Halt! Who goes there?".startswith('Halt')

True

In [27]:
"coconut".endswith('nut')

True

In [28]:
"It's just a flesh wound!".find('u')

6

In [29]:
"It's just a flesh wound!".index('scratch')

ValueError: substring not found

In [30]:
"old woman".isalpha()

False

In [31]:
"37".isdecimal()

True

In [32]:
"I'm 37".isalnum()

False

In [34]:
"Black Knigiht".lower()

'black knigiht'

In [35]:
"Black Knigiht".upper()

'BLACK KNIGIHT'

In [36]:
"flesh wound!".replace('flesh wound', 'scratch')

'scratch!'

In [37]:
" I'm not dead. ".strip()

"I'm not dead."

In [38]:
"NI! NI! NI! NI!".split(sep=' ')

['NI!', 'NI!', 'NI!', 'NI!']

In [39]:
"3,4".partition(',')

('3', ',', '4')

In [45]:
"nice".center(10, ' ')

'   nice   '

In [51]:
"9".zfill(5)

'00009'

## join, splitlines, replace 메서드

In [52]:
# join 문자열을 연결하여 새로운 문자열을 반환
d1 = '40°'
m1 = "46"
s1 = "52.837"
u1 = "N"

coords = ' '.join([d1, m1, s1, u1])
coords

'40° 46 52.837 N'

In [57]:
# splitlines 여러 행을 가지 문자열을 분리한 다음 리스트로 반환
multi_str = """Guard: What? Ridden on a horse?
King Arthur: Yes!
Guard: You're using coconuts!
King Arthur: What?
Guard: You've got ... coconut[s] and you're begin' 'em together.
"""

multi_str_split = multi_str.splitlines()
multi_str_split

['Guard: What? Ridden on a horse?',
 'King Arthur: Yes!',
 "Guard: You're using coconuts!",
 'King Arthur: What?',
 "Guard: You've got ... coconut[s] and you're begin' 'em together."]

In [58]:
# 인덱스 슬라이싱으로 Guard의 대사만 가져온다.
guard = multi_str_split[::2]
guard

['Guard: What? Ridden on a horse?',
 "Guard: You're using coconuts!",
 "Guard: You've got ... coconut[s] and you're begin' 'em together."]

In [59]:
# replace
# Guard 의 대사에 'Guard:' 라는 문자열을 뺀다.
guard = multi_str.replace("Guard: ", "").splitlines()[::2]
guard

['What? Ridden on a horse?',
 "You're using coconuts!",
 "You've got ... coconut[s] and you're begin' 'em together."]

## 문자열 포매팅

In [60]:
var = 'flesh wound'
s = "It's just a {}!"

s.format(var)

"It's just a flesh wound!"

In [61]:
s.format('scratch')

"It's just a scratch!"

In [62]:
s = """Black Knight: 'Tis but a {0}.
King Arthur: A {0}? Your arm's off!
'"""

s.format('scratch')

"Black Knight: 'Tis but a scratch.\nKing Arthur: A scratch? Your arm's off!\n'"

In [63]:
s = 'Haden Planetarium Coordinates: {lat}, {lon}'
s.format(s, lat='40.7815 N', lon='73.9733 W')


'Haden Planetarium Coordinates: 40.7815 N, 73.9733 W'

## 숫자 데이터 포매팅

In [64]:
'Some digits of pi: {}'.format(3.1415926)

'Some digits of pi: 3.1415926'

In [66]:
# 플레이스 홀더에 :, 를 넣으면 쉼표를 넣어 숫자를 표현한다.
"In 2005, Lu Chao of China recited {:,} digits of pi".format(67890)

'In 2005, Lu Chao of China recited 67,890 digits of pi'

In [68]:
# 소수점 이하 숫자 4개까지 출력 %를 사용하면 결과값을 백분율로 환산하여 출력한다.
"I remember {0:.4} or {0:.4%} of what Lu Chao recited".format(7/67890)

'I remember 0.0001031 or 0.0103% of what Lu Chao recited'

In [72]:
# 빈 칸을 0으로 채워 출력한다.
"My ID number is {0:05d}".format(42)

'My ID number is 00042'

## % 연산자로 포매팅하기

In [73]:
# %d 로 숫자 삽입
s = "I only know %d digits of pi" % 7
s

'I only know 7 digits of pi'

In [74]:
# %s 로 문자열 삽입
"Some digits of %(cont)s: %(value).2f" % {'cont': 'e', 'value': 2.718}

'Some digits of e: 2.72'

## f-strings 포매팅 

In [77]:
# python 3.6 이상에서만 작동된다. 현재 Python Kernel 3.5 이므로 작동 안함 
var = 'flesh wound'
s = f"It's just a {var}!"
print(s)

s = f"Hyden Planetarium Coordinates: {lat}, {lon}"
print(s)

SyntaxError: invalid syntax (<ipython-input-77-126717840c9e>, line 3)