## Unit 24. 문자열 응용
#### 24.1 문자열 조작

- 변경(replace) method

In [4]:
# 문자열의 메소드는 자기 보존
s = 'Hello, python'
s.replace('python', 'World!')

'Hello, World!'

In [5]:
s

'Hello, python'

In [7]:
# 리스트의 메소드는 자기 파괴적
a = [10, 20, 30]
a.sort(reverse=True)
a

[30, 20, 10]

In [8]:
s = s.replace('python', 'World!')
s

'Hello, World!'

In [9]:
# 정규 표현식(Regular expression)
import re
s = '안녕하세요? Python 코딩 강좌입니다.'
re.sub('[^A-Za-z ]', ' ', s)    # 패턴, 변경될 값, 문자열

'       Python          '

In [10]:
# 한글 이외에는 공백으로 변경
re.sub('[^ㄱ-ㅎㅏ-ㅣ가-힣]', ' ', s)

'안녕하세요         코딩 강좌입니다 '

- 문자열 분리(split)

In [11]:
s = 'apple pear grape pineapple orange'
d = s.split()
d

['apple', 'pear', 'grape', 'pineapple', 'orange']

In [12]:
s = 'apple,pear,grape,pineapple,orange'
d = s.split(',')
d

['apple', 'pear', 'grape', 'pineapple', 'orange']

In [14]:
stopwords = ['a', 'the', 'I', 'am', 'is']
s = 'I am a graduate student.'
d = s.split()
d = [word for word in d if word not in stopwords]
d

['graduate', 'student.']

- 문자열 리스트 연결(join)

In [15]:
' '.join(d)

'graduate student.'

In [16]:
' '.join('apple,pear,grape,pineapple,orange'.split(','))

'apple pear grape pineapple orange'

In [17]:
'apple,pear,grape,pineapple,orange'.replace(',',' ')

'apple pear grape pineapple orange'

In [18]:
s = 'I am a graduate student.'
' '.join(word for word in s.split() if word not in stopwords)

'graduate student.'

In [22]:
d = s.split()
sentence = []
for word in d:
    if word not in stopwords:
        sentence.append(word)
sentence = ' '.join(sentence)
sentence

'graduate student.'

- 대소문자 변환(upper, lower)

In [23]:
'Python'.lower(), 'Python'.upper()

('python', 'PYTHON')

- 공백 삭제(strip, lstrip, rstrip)

In [26]:
s = '  Python  '
s.lstrip(), s.rstrip(), s.strip()

('Python  ', '  Python', 'Python')

- 구두점 제거

In [27]:
s = ',=Python.!'
s.strip()

',=Python.!'

In [28]:
import string
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

In [29]:
s.strip(string.punctuation)

'Python'

- 메소드 체이닝(method chaining)

In [30]:
s = ',.Python.!'
s.lower().strip(string.punctuation)

'python'

In [32]:
s = '   123,000원'
s = int(s.strip().strip('원').replace(',',''))
s

123000

In [35]:
s = 'USD 1,752.37$'
s = float(s.strip('USD $').replace(',',''))
s

1752.37

- 정렬(ljust, rjust, center)

In [37]:
'python'.ljust(10), 'python'.rjust(10), 'python'.center(11)

('python    ', '    python', '   python  ')

- 위치 찾기(find, rfind, index)

In [38]:
'apple pineapple'.find('pp')

1

In [40]:
'apple pineapple'.find('xy')

-1

In [41]:
s = 'A quick brown fox jumps over the lazy dog.'
s.find('fox')

14

In [42]:
s.find('wolf')

-1

In [43]:
search = 'fox'
if s.find(search) >= 0:
    print('문장 안에 찾고자 하는 문자열이 있습니다.')
else:
    print('문장 안에 찾고자 하는 문자열이 없습니다.')

문장 안에 찾고자 하는 문자열이 있습니다.


In [44]:
'fox' in s

True

In [46]:
'apple pineapple'.rfind('pp')

11

- 문자열 개수 세기

In [47]:
'apple pineapple'.count('pp')

2

#### 연습문제
<pre>
1. 디지털 시계(00:00 ~ 23:59)가 있다. 
하루 동안 3이라는 숫자가 표시되는 시간은 몇 초인가?
2. 1에서 1000까지의 숫자에서 
0, 1, ... , 9는 몇 번 나오는가?
</pre>

In [52]:
# 문제 1
three = 0
for hour in range(24):
    for minute in range(60):
        if ''.join([str(hour), str(minute)]).find('3') >= 0:
            three += 60
print(three)

29700


In [54]:
# 문제 2
num_string = ''
for i in range(1, 1001):
    num_string += str(i)
for j in range(10):
    print(j, num_string.count(str(j)))

0 192
1 301
2 300
3 300
4 300
5 300
6 300
7 300
8 300
9 300


#### 24.2 문자열 서식 지정자와 포맷팅

In [61]:
ss = 'python'            # 문자열
f'==={ss:10s}==='

'===python    ==='

In [62]:
dd = 3                   # 정수
f'==={dd:4d}:{dd:02d}==='

'===   3:03==='

In [63]:
year, month, day, hour, minute = 2022, 3, 29, 11, 36
f'오늘은 {year}-{month:02d}-{day:02d} 이고, 시간은 {hour:02d}:{minute:02d} 입니다.'

'오늘은 2022-03-29 이고, 시간은 11:36 입니다.'

In [65]:
price1, price2 = 35000, 1200000
print(f'가격1: {price1:10,d}원')
print(f'가격2: {price2:10,d}원')

가격1:     35,000원
가격2:  1,200,000원


In [67]:
import math
f'파이값은 {math.pi:8.5f} 입니다.'

'파이값은  3.14159 입니다.'