In [None]:
"""
1. 파일명 : 1_method_manipulations.ipynb
2. 개요: 파이썬의 조건문 사용법 과 문제
3. 작성자 : adam9e96
4. 업데이트: 2024-10-22
"""

# 메소드 개요
- **메소드 (method)**: 특정 객체에 속하는 함수. 메소드는 객체의 상태를 변경하거나 객체와 관련된 작업을 수행하는 데 사용된다. 
    - 예를 들어, 문자열 객체나 리스트 객체와 같은 다양한 데이터 타입에는 그 데이터 타입에 특화된 메소드들이 있다.
- 함수와 메소드의 차이점은 호출 방식에 있습니다. 함수는 독립적으로 호출할 수 있지만, 메소드는 반드시 `객체`를 통해서만 호출 가능하다. 즉, 메소드는 객체의 상태나 행동과 밀접한 관련이 있다..

## 1. 문자열 메소드
- Python의 문자열 (`str`)은 일반적인 작업을 위해 다양한 내장 메소드를 제공한다. 
- 문자열 메소드는 문자열의 변형, 탐색, 분할, 조합 등을 간편하게 처리할 수 있다.

#### 1.1 `format()`
문자열의 형식화된 출력을 위해 사용됩니다. 주로 출력 형식을 맞추기 위해 사용하며, 문자열 내에서 변수 값을 동적으로 삽입하는 데 유용합니다.
- `<`: 지정된 너비 내에서 왼쪽 정렬
- `>`: 지정된 너비 내에서 오른쪽 정렬
- `^`: 지정된 너비 내에서 가운데 정렬

In [1]:
# 10d는 10자리의 필드 폭을 의미
print("10자리 폭 왼 쪽 정렬 '{:<10d}'".format(123))  # 10자리 폭 왼 쪽 정렬 '123       '
print("10자리 폭 오른 쪽 정렬 '{:>10d}'".format(123))  # 10자리 폭 오른 쪽 정렬 '       123'
print("10자리 폭 가운데 정렬 '{:^10d}'".format(123))  # 10자리 폭 가운데 정렬 '   123    '
print()
# 채움문자를 지정하면 공백 대신 채움문자가 빈자리를 채움
print("10자리 폭 왼 쪽 정렬 채움문자 '{:*<10d}'".format(123))  # 10자리 폭 왼 쪽 정렬 채움문자 '123*******'
print("10자리 폭 오른 쪽 정렬 채움문자 '{:*>10d}'".format(123))  # 10자리 폭 오른 쪽 정렬 채움문자 '*******123'
print("10자리 폭 가운데 쪽 정렬 채움문자 '{:*^10d}'".format(123))  # 10자리 폭 가운데 쪽 정렬 채움문자 '***123****'
# 현재는 많이는 사용안한다.

10자리 폭 왼 쪽 정렬 '123       '
10자리 폭 오른 쪽 정렬 '       123'
10자리 폭 가운데 정렬 '   123    '

10자리 폭 왼 쪽 정렬 채움문자 '123*******'
10자리 폭 오른 쪽 정렬 채움문자 '*******123'
10자리 폭 가운데 쪽 정렬 채움문자 '***123****'


#### 1.2 `count()`
- 문자열에서 특정 부분 문자열이 나타나는 횟수를 반환한다.
- 특정 단어의 빈도수를 확인할 때 유용하다.

In [1]:
s = '내가 그린 기린 그림은 목 긴 기린 그림이고, 네가 그린 기린 그림은 목 짧은 기린 그림이다.'
print(s.count('기린'))  # 출력: 4
print(s.find('기린'))  # 6

# 시작 인덱스를 지정하여 그 이후로 나타나는 특정 문자열의 개수를 세어보기
# 인덱스를 지정해서 범위를 지정할 수 있음
s = 'best of best'
print(s.count('best', 5))  # 출력: 1 / 인덱스 5번 부터 검색

# 마이너스 인덱스를 사용하여 문자열의 뒤에서부터 검색 범위를 지정하기

# 마이너스 인덱스를 사용할 수 있음
s = 'best of best'
print(s.count('best', -7))  # 출력: 1 / o 부터 검색

s = '이것은 샘플 텍스트입니다. 반복된 단어와 반복된 구문이 있습니다.'
print(s.count('반복된'))  # 출력: 2

4
6
1
1
2


#### 1.3 `find()`와 `index()`
- **`find()`**: 주어진 부분 문자열의 첫 번째 인덱스를 반환하거나 찾지 못하면 `-1`을 반환한다. 문자열 내에서 특정 문자열의 위치를 찾는 데 사용된다.
- **`index()`**: `find()`와 유사하게 동작하지만, 부분 문자열을 찾지 못하면 `ValueError`를 발생시킨다. 따라서 문자열이 반드시 포함되어야 할 경우 사용된다.

In [3]:
# find()
s = 'apple'
print(s.find('p'))  # 출력: 1
print(s.find('z'))  # 출력: -1
print(s.index('p'))  # 출력: 1
# print(s.index('z'))  # ValueError 발생

## find메소드 활용
# 1. 특정 문자열의 존재 여부 확인: .find() 메소드의 반환값이 -1인지 아닌지를 확인하여 특정 문자열의 존재 여부를 판단
# 2. 검색 범위 지정: .find() 메소드에는 시작 인덱스를 옵션으로 지정할 수 있어, 문자열의 특정 부분에서부터 검색을 할 수있음.
#    문자열의 일부분에서만 검색을 수행하고자 할 때 유용합니다.

if s.find('z') == -1:
    print(s)

# 인덱스를 이용해서 검색할 범위를 지정 가능
# 시작할 인덱스를 지정하지 않는 경우에는 문자열의 처음부터 찾고, 시작할 인덱스를 지정하는 경우 지정된 인덱스부터 찾음
s = 'best of best'
print(s.find('best'))  # 0
print(s.find('best', 5))  # 8

# find() 메소드와 찾는 방향이 다른 rfind() 메소드 . right + find()
# right와 find 를 합친 이름으로 오른쪽 부터 찾음
s = 'best of best'
print(s.rfind('best'))  # 8

# index()
s = 'apple'
# find() 메소드 사용 예
print(s.find('p'))  # 1
print(s.find('z'))  # -1

# index() 메소드 사용 예
print(s.index('p'))  # 1
# print(s.index('z'))  # ValueError: substring not found
# 통상적으로 index()는 잘 사용안하고 find()을 사용함
# 빈 문자열 검색
print(s.index(''))  # 0


1
-1
1
apple
0
8
8
1
-1
1
0


#### 1.4 대소문자 변환
- `upper()`, `lower()`, `capitalize()`는 문자열의 대소문자를 변환하는 데 사용된다. 
- 데이터의 표준화를 위해 자주 사용된다.

In [4]:
# 대소문자 변환 메소드
# upper : 모두 대문자로 변환한 결과를 반환
# lower : 모두 소문자로 변환한 결과를 반환
# capitalize : 첫 글자는 대문자로 변환하고 나머지는 소문자로 변환한 결과를 반환

s = 'hello world'
print(s.upper())  # 출력: HELLO WORLD
print(s.lower())  # 출력: hello world
print(s.capitalize())  # 출력: Hello world

HELLO WORLD
hello world
Hello world


#### 1.5 `split()`과 `join()`
- **`split()`**: 문자열을 구분자를 기준으로 나누어 리스트로 반환합니다. 주로 데이터를 분할할 때 사용됩니다.
- **`join()`**: 반복 가능한 객체의 요소들을 문자열 구분자로 연결합니다. 리스트의 요소들을 하나의 문자열로 결합할 때 유용합니다.

In [25]:
# join() # 거의 쓸일이 없음
# 인수로 전달한 반복가능객체(문자열, 리스트 등)의 각 요소 사이에
# 문자열을 포함시켜 새로운 문자열을 만들고 그 결과를 반환

print('-'.join('python'))  # p-y-t-h-o-n

print('+'.join(['a', 'b', 'c', 'd', 'e']))  # a+b+c+d+e

# 포함하는 문자 없이 단순하게 리스트의 요소들을 연결하고자 한다면 빈 문자열 사용
print(' '.join(['x', 'y', 'z']))  # x y z
a = {'a': 'apple', 'b': 'banana'}
print(''.join(a))  # ab / 딕셔너리의 경우 key를 연결

# 실제 이러한 작업이 필요한 경우 for문으로도 가능해서 이 함수를 쓰면 좋지만
# 거기 까지 생각이 안나서 잘 안쓰게됨


p-y-t-h-o-n
a+b+c+d+e
x y z
ab


In [6]:
# split()
# 하나의 문자열을 여러 개의 문자열로 분리해서 저장한 리스트를 반환

s = 'Life is too short'
s2 = s.split()  # split() 메소드에 아무 인수도 전달하지 않으면 공백 문자를 기준으로 각 문자열이 분리

print(s2)  # ['Life', 'is', 'too', 'short']

s = '010-1234-5678'
s2 = s.split('-')  # 공백 대신 특정 문자열을 기준으로 분리하는 기법
print(s2)  # ['010', '1234', '5678']

s = 'apple,banana,grape'
parts = s.split(',')
print(parts)  # 출력: ['apple', 'banana', 'grape']

joined_str = '-'.join(parts)
print(joined_str)  # 출력: apple-banana-grape

# 이건 반복문으로도 되지만 split()메소드를 사용하면 간단하게 처리가 가능함으로 알아두면 좋다.

['Life', 'is', 'too', 'short']
['010', '1234', '5678']
['apple', 'banana', 'grape']
apple-banana-grape


#### 1.6 `replace()`
부분 문자열을 다른 문자열로 대체합니다. 특정 단어나 문구를 변경할 때 유용합니다.

In [7]:
# replace()
s = 'Life is too short'
s2 = s.replace('short', 'long')
print(s2)  # Life is too long

# 특정 문자열을 제거하기 위한 용도로 사용 <- 자주 사용함
s = '010-1234-5678'
s2 = s.replace('-', '')  # - 제거
print(s2)  #01012345678 

# replace() 메소드의 경우 특정 문자열을 삭제하는 용도로 많이 사용한다.

Life is too long
01012345678


#### 1.7 문자열 다듬기
- **`strip()`**: 문자열 양 끝의 불필요한 문자를 제거합니다. 주로 사용자 입력값의 공백을 제거할 때 사용됩니다.
- **`lstrip()`**: 문자열의 왼쪽 끝의 불필요한 문자를 제거합니다.
- **`rstrip()`**: 문자열의 오른쪽 끝의 불필요한 문자를 제거합니다.

In [11]:
s = '  hello world  '
print(s.strip())  # 출력: 'hello world'
s = '     apple'
print(len(s))  # 10

s2 = s.lstrip()
print(s2)  # apple
print(len(s2))  # 5 . 공백 5칸 제거
# 공백도 문자열임.
# 주로 공백제거 용도로 많이 사용함.
s3 = 'apple is very short      '
s4 = s3.rstrip()
print(s3)  # apple is very short      
print(s4)  # apple is very short  
print(len(s3))  # 25
print(len(s4))  # 19
# 다른 언어(java)에서는 trim 이라는 메소드로 동일한 기능을 제공한다. 
# 대부분의 언어에 trim이나 strip라는 이름으로 불필요한 문자열 제거 메소드를 제공한다.

s = '###This is a test###'
s2 = s.lstrip('#')
print(s2)  # 'This is a test###'
# lstrip('#') 메소드는 문자열 왼쪽 끝에 있는 '#' 문자를 제거합니다.
s = '---example---'
s2 = s.rstrip('-')
print(s2)  # '---example'
# rstrip('-') 메소드는 문자열 오른쪽 끝에 있는 '-' 문자를 제거합니다.

hello world
10
apple
5
apple is very short      
apple is very short
25
19
This is a test###
---example


In [12]:
# 활용 1
# 주민등록번호에서 생년월일 6자리를 추출하는 프로그램
# 사용자로 부터 하이픈을 포함한 전체 주민등록번호를 입력받아 처리를 하는데
# 만약 하이픈의 위치가 올바르지 않다면 오류 메시지를 출력하고 다시 입력 받도록 처리.

# split을 시용한 방법
while True:
    p = input('주민등록번호를 입력하세요(하이픈을 포함해서 총 14자리) >>> ')
    if p.find('-') != 6:  # 문자열 내부에 포함된 특정 문자열을 찾고자 할 때 사용
        print('하이픈의 위치가 잘못되었습니다.')
        continue
    # e.g) 000000-0000000
    birthday = p.split('-')
    print(birthday)
    print('생년월일은 {} 입니다.'.format(birthday[0]))
    print(f'생년월일은 {p[0:6]} 입니다.')  # 문자열 슬라이싱 사용
    break

['990324', '1655555']
생년월일은 990324 입니다.
생년월일은 990324 입니다.


# 문제
1. 우리나라의 전화번호는 '지역번호-국번-가입자 개별번호'형식으로 되어 있습니다.

02-543-2109
02-2345-6789
032-789-0123
031-4567-8900

어떤 형식의 전화번호를 입력하더라도 '국번'을 추출하여 출력하는 프로그램을 구현하세요.

실행 예)
전화번호를 입력하세요 >>> 02-1234-5678
1234

2. '숫자3자리-숫자2자리-숫자5자리' 형식(예: 123-45-67890)의 사업자등록번호를 입력받아서 형식이 
맞는지 점검하는 프로그램을 구현하세요.
다음 지시사항을 모두 점검해야 합니다.

지시사항
1. 전체 글자 수를 점검합니다.
2. 모든 하이픈(-)의 위치가 올바른지 점검합니다.
3. 하이픈(-)을 제외하면 모두 숫자인지 점검합니다.

실행 예) 
사업자등록번호를 입력하세요(예: 123-45-67890) >>> 123-사오-67890
올바른 형식이 아닙니다.

--------------------

사업자등록번호를 입력하세요(예: 123-45-67890) >>> 123-4-67890
올바른 형식이 아닙니다
--------------------

사업자등록번호를 입력하세요(예: 123-45-67890) >>> 123-45-67890
올바른 형식입니다.

힌트 : 숫자인지는 점검할 때는 isdecimal() 메서드를 이용합니다.

In [10]:
# 문제1
phone = input('전화번호를 입력하세요 >>> ')
# 02-543-2109 
# 02-2345-6789 
# 032-789-0123 
# 031-4567-8900

# case1
code = phone.split('-')[1]
print(code)

# case2
start = phone.find('-') + 1  # 첫번째 '-' 이 나오는 인덱스의 다음 인덱스를 구함.
end = phone.find('-', start)  # 인덱스로 범위를 지정해 두번째 '-' 인덱스를 구함
print(start)  # 테스트 4
print(end)  # 테스트 7
code = phone[start:end]  # 문자열 슬라이싱을 사용
print(code)

789
4
7
789


In [8]:
# 문제 2

# 형식검사:
input_number = input('사업자등록번호를 입력하세요(예:123-45-67890 >>> ')
if len(input_number) != 12:  # 전체 글자 수 점검
    print('올바른 형식이 아닙니다.')
    print('0')
elif input_number.find('-') != 3 or input_number.find('-', 5) != 6:
    print('올바른 형식이 아닙니다.')
    print('1')  # 에러 코드 자체
elif input_number.replace('-', '').isnumeric() != 1:  # - 제거
    print('올바른 형식이 아닙니다.')  # 문자열이 들어간 경우
    print('2')
else:
    print(input_number)
    print('올바른 형식입니다.')
# s = input_number.find('-')  # 3 # 6
# print(s)



올바른 형식이 아닙니다.
0


In [None]:
# case1

no = input('사업자등록번호를 입력하세요(예:123-45-67890 >>> ')
if len(no) != 12:  # 전체 글자수 (12) 확인
    print('올바른 형식이 아닙니다.')
elif no.find('-') != 3:  # 첫번째 '-' 위치 확인
    print('올바른 형식이 아닙니다.')
elif no.find('-', 4) != 6:  # 두번째 '-' 위치 확인
    print('올바른 형식이 아닙니다.')
elif not no.replace('-').isdecimal():  # '-' 을 제외한 문자가 숫자인지 확인
    print('올바른 형식이 아닙니다.')
else:
    print('올바른 형식입니다.')

In [None]:
# case 2
condition1 = (no.find('-') == 3)  # 첫번째 '-' 위치 확인
condition2 = (no.find('-', 4) == 6)  # 두번째 '-' 위치 확인
condition3 = (len(no)) == 12  # 전체 글자수 (12) 확인
condition4 = (no.replace('-').isdecimal())  # '-' 을 제외한 문자가 숫자인지 확인
if condition1 or condition2 or condition3 or condition4:
    print('올바른 형식입니다.')
else:
    print('올바른 형식이 아닙니다.')