## 🗂️ 문자열(String)

#### 📌 문자열 개념
- 문자, 단어 등으로 구성된 문자들의 집합
- 시퀀스 자료형(Sequence Data Type)

#### 📌 문자열 생성
- 파이썬에서 문자열은 작은 따옴표(') 또는 큰 따옴표(")로 표현

In [1]:
print('Hello')
print("Hello")
print('''Hello''')
print("""Hello""")

Hello
Hello
Hello
Hello


#### 📌 따옴표가 있는 문자열 생성
- 문자열에 작은 따옴표가 있을 경우 큰 따옴표로 둘러싸서 표현
- 문자열에 큰 따옴표가 있을 경우 작은 따옴표로 둘러싸서 표현
- 이스케이프 코드(\\)를 이용하여 작은 따옴표와 큰 따옴표를 문자열에 포함

In [2]:
s = "Python's favorite food is perl"
print(s)

Python's favorite food is perl


In [3]:
s = '"Python is very easy." he says'
print(s)

"Python is very easy." he says


In [4]:
s = "Python\'s favorite food is perl. \"Python is very easy\" he says"
print(s)

Python's favorite food is perl. "Python is very easy" he says


#### 📌 이스케이프 코드(Escape Code)
- 특수 문자
- 문자 앞에 백슬래시(\\) 사용
- 문자열에서 특수 문자를 표현하는데 사용

|이스케이프 코드|이름|
|:-------------:|:--:|
|\\|역슬래시(backslash)|
|\\'|작은 따옴표(single quote)|
|\\"|큰 따옴표(double quote)|
|\\a|알람(alarm)|
|\\b|백스페이스(backspace)|
|\\f|폼 피드(form feed)|
|\\n|라인 피드(line feed)|
|\\r|캐리지 리턴(carriage return)|
|\\t|수평 탭(tab)|
|\\v|수직 탭(tab)|
|\\ooo|8진수 문자(octal value)|
|\\xhh|16진수 문자(hexadecimalvalue)|

#### 📌 여러 줄이 있는 문자열 생성
- 이스케이프 코드(\\n)을 이용하여 여러 줄이 있는 문자열 생성 가능

In [5]:
text = "동해물과 백두산이 마르고 닳도록\n하느님이 보우하사 우리나라 만세\n무궁화 삼천리 화려강산\n대한 사람 대한으로 길이 보전하세"
print(text)

동해물과 백두산이 마르고 닳도록
하느님이 보우하사 우리나라 만세
무궁화 삼천리 화려강산
대한 사람 대한으로 길이 보전하세


- 작은 따옴표 3개 또는 큰 따옴표 3개를 이용하여 여러 줄이 있는 문자열 생성

In [6]:
text = '''동해물과 백두산이 마르고 닳도록
하느님이 보우하사 우리나라 만세
무궁화 삼천리 화려강산
대한 사람 대한으로 길이 보전하세'''
print(text)

동해물과 백두산이 마르고 닳도록
하느님이 보우하사 우리나라 만세
무궁화 삼천리 화려강산
대한 사람 대한으로 길이 보전하세


## 🗂️ 문자열 연산

#### 📌 문자열 더하기
- ```+``` 연산자를 사용하여 문자열 연결

In [7]:
s1 = "Hello"
s2 = " World"
print(s1 + s2)

Hello World


#### 📌 문자열 곱하기
- ```*``` 연산자를 사용하여 문자열 반복

In [8]:
s = "Hello"
print(s * 3)

HelloHelloHello


#### 📌 문자열 길이
- 문자열 길이를 구하는 ```len()```` 함수

In [9]:
s = "Hello"
print(len(s))

5


#### 📌 문자열 인덱싱(Indexing)
- 문자열은 리스트처럼 문자 하나하나가 상대적인 주소(offset)을 가짐
- 이 주소를 사용해 할당된 값을 가져오는 인덱싱을 사용

In [10]:
s = "Hello"

print(s[0])
print(s[1])
print(s[2])
print(s[3])
print(s[4])

print(s[-5])
print(s[-4])
print(s[-3])
print(s[-2])
print(s[-1])

H
e
l
l
o
H
e
l
l
o


#### 📌 문자열 슬라이싱(Slicing)
- 문자열의 주소를 이용하여 문자열의 조각(부분)을 추출

In [11]:
s = "Hello World. Python is very easy."

print(s[0:12])
print(s[:12])
print(s[13:33])
print(s[13:])
print(s[-20:])
print(s[0:-1])
print(s[:])

Hello World.
Hello World.
Python is very easy.
Python is very easy.
Python is very easy.
Hello World. Python is very easy
Hello World. Python is very easy.


## 🗂️ 문자열 메소드(String Method)
- 파이썬은 문자열 처리를 아주 쉽게 처리할 수 있는 많은 메소드들을 제공

|함수|설명|
|:--:|:--:|
|capitalize()|첫 문자를 대문자로 하고 나머지 문자를 소문자로 하는 문자열 반환|
|casefold()|모든 문자를 소문자로 하는 문자열 변환|
|count(sub[, start[, end]])|[start, end] 범위에서 부분 문자열 sub의 개수를 반환|
|find(sub[, start[, end]])|[start, end] 범위에서 부분 문자열 sub의 가장 작은 위치 인덱스를 반환(sub가 발견되지 않는 경우 -1 반환)|
|rfind(sub[, start[, end]])|[start, end] 범위에서 부분 문자열 sub의 가장 큰 위치 인덱스를 반환(sub가 발견되지 않는 경우 -1 반환)|
|index(sub[, start[, end]])|find()와 유사하지만 부분 문자열 sub가 없으면 ValueError 발생|
|rindex(sub[, start[, end]])|rfind()와 유사하지만 부분 문자열 sub가 없으면 ValueError 발생|
|isalnum()|문자열의 모든 문자가 영문자 또는 숫자로만 구성되어 있으면 True 아니면 False 반환|
|isalpha()|문자열의 모든 문자가 영문자로만 구성되어 있으면 True 아니면 False 반환|
|isdecimal()|문자열의 모든 문자가 10진수 문자로만 구성되어 있으면 True 아니면 False 반환|
|isdigit()|문자열의 모든 문자가 숫자로만 구성되어 있으면 True 아니면 False 반환|
|isnumeric()|문자열의 모든 문자가 수치형으로만 구성되어 있으면 True 아니면 False 반환|
|isidentifier()|문자열이 유효한 식별자인 경우 True 반환|
|isspace()|문자열 내에 공백 문자가 있을 경우 True 반환 아니면 False 반환|
|istitle()|문자열에서 모든 단어에 대해 첫 글자만 대문자이고 나머지는 소문자인 문자열일 경우 True 반환|
|islower()|문자열의 모든 문자가 소문자일 경우 True 반환 아니면 False 반환|
|isupper()|문자열의 모든 문자가 대문자일 경우 True 반환 아니면 False 반환|
|join(iterable)|iterable에 있는 각 문자 사이에 연결된 문자열을 반환|
|center(width[, fillchar])|너비만큼의 문자열에서 중앙 정렬된 문자열을 반환|
|ljust(width[, fillchar])|너비만큼의 문자열에서 왼쪽 정렬된 문자열을 반환|
|rjust(width[, fillchar])|너비만큼의 문자열에서 오른쪽 정렬된 문자열을 반환|
|lower()|모든 문자가 소문자로 변환된 문자열을 반환|
|upper()|모든 문자가 대문자로 변환된 문자열을 반환|
|title()|문자열에서 모든 단어에 대해 첫 글자만 대문자이고 나머지는 소문자인 문자열 반환|
|swapcase()|문자열에서 소문자를 대문자로 대문자를 소문자로 변환한 문자열 반환|
|strip([chars])|문자열 양쪽에 지정된 chars 또는 공백을 제거한 문자열을 반환|
|lstrip([chars])|문자열 왼쪽에 지정된 chars 또는 공백을 제거한 문자열을 반환|
|rstrip([chars])|문자열 오른쪽에 지정된 chars 또는 공백을 제거한 문자열을 반환|
|partition(sep)|문자열에서 첫번째 sep를 기준으로 분할하여 3개의 튜플을 반환|
|rpartiion(sep)|문자열에서 마지막 sep를 기준으로 분할하여 3개의 튜플을 반환|
|replace(old, new[, count])|문자열의 모든 old를 new로 교체한 문자열을 반환|
|split(seq=None, maxsplit=1)|seq를 구분자 문자열로 사용하여 문자열의 단어 목록을 반환|
|rsplit(seq=None, maxsplit=1)|seq를 구분자 문자열로 사용하여 문자열의 단어 목록을 반환|
|splitlines([keepends])|문자열에서 라인 단위로 구분하여 리스트를 반환|
|startswith(prefix[, start[, end]])|[start, end] 범위에서 지정한 prefix로 시작하면 True 아니면 False 반환|
|endswith(suffix[, start[, end]])|[start, end] 범위에서 지정한 suffix로 끝나면 True 아니면 False 반환|
|zfill(width)|너비 만큼의 문자열에서 비어있는 부분에 '0'이 채워진 문자열 반환|

#### 📌 capitalize() · casefold()

In [12]:
s = "string"
print(s.capitalize())

String


In [13]:
s = "String"
print(s.casefold())

string


#### 📌 count()

In [14]:
s = "string string"
print(s.count("s"))
print(s.count("string"))

2
2


#### 📌 find() · rfind()

In [15]:
s = "string string"
print(s.find("s"))
print(s.find("ing"))
print(s.rfind("s"))
print(s.rfind("ing"))

0
3
7
10


#### 📌 index() · rindex()

In [16]:
s = "string string"
print(s.index("s"))
print(s.index("ing"))
print(s.rindex("s"))
print(s.rindex("ing"))
print(s.index("z"))

0
3
7
10


ValueError: substring not found

#### 📌 isalnum()

In [17]:
print("string".isalnum())
print("한글".isalnum())
print("123".isalnum())
print("!@#".isalnum()) # 특수문자
print("Hello World".isalnum()) # 공백 포함

True
True
True
False
False


#### 📌 isalpha()

In [18]:
print("string".isalpha())
print("한글".isalpha())
print("123".isalpha()) # 숫자
print("!@#".isalpha()) # 특수문자
print("Hello World".isalpha()) # 공백 포함

True
True
False
False
False


#### 📌 isdecimal()

In [19]:
print("123".isdecimal())
print("1.23".isdecimal())
print("3²".isdecimal())
print("½".isnumeric())

True
False
False
True


#### 📌 isdigit()

In [20]:
print("123".isdigit())
print("1.23".isdigit())
print("3²".isdigit())
print("½".isdigit())

True
False
True
False


#### 📌 isnumeric()

In [21]:
print("123".isnumeric())
print("1.23".isnumeric())
print("3²".isnumeric())
print("½".isnumeric())

True
False
True
True


#### 📌 isidentifier()

In [22]:
print("123".isidentifier())
print("Ture".isidentifier()) # 예약어 True
print("False".isidentifier()) # 예약어 False
print("print".isidentifier()) # 예약어 print
print("s".isidentifier()) # 변수명

False
True
True
True
True


#### 📌 isspace()

In [23]:
print(" ".isspace())
print("Hello World".isspace())

True
False


#### 📌 istitle()

In [24]:
print("String".istitle())
print("STRING".istitle())
print("String String".istitle())
print("String string".istitle())

True
False
True
False


#### 📌 islower()

In [25]:
print("string".islower())
print("String".islower())
print("STRING".islower())

True
False
False


#### 📌 isupper()

In [26]:
print("string".isupper())
print("String".isupper())
print("STRING".isupper())

False
False
True


#### 📌 join()

In [27]:
s = "string"
print(" ".join(s))
print("_".join(s))
print("|".join(s))

s t r i n g
s_t_r_i_n_g
s|t|r|i|n|g


#### 📌 center() · ljust() · rjust()

In [28]:
print("'" + "String".center(10) + "'")
print("'" + "String".ljust(10) + "'")
print("'" + "String".rjust(10) + "'")

'  String  '
'String    '
'    String'


#### 📌 lower() · upper() · title() · swapcase()

In [29]:
print("String".lower())
print("String".upper())
print("string string".title())
print("String".swapcase())

string
STRING
String String
sTRING


#### 📌 strip() · lstrip() · rstrip()

In [30]:
print("  String  ".strip())
print("  String  ".lstrip())
print("  String  ".rstrip())

String
String  
  String


#### 📌 partition() · rpartition()

In [31]:
print("String String".partition("t"))
print("String String".rpartition("t"))

('S', 't', 'ring String')
('String S', 't', 'ring')


#### 📌 replace()

In [32]:
print("String".replace("Str", "R"))

Ring


#### 📌 split() · rsplit() · splitlines()

In [33]:
print("1 2 3".split())
print("1_2_3".split("_"))
print("1_2_3".split("_", 1))
print("1_2_3".rsplit("_"))
print("1_2_3".rsplit("_", 1))
print("123\n123\n123".splitlines())

['1', '2', '3']
['1', '2', '3']
['1', '2_3']
['1', '2', '3']
['1_2', '3']
['123', '123', '123']


#### 📌 startswith() · endswith()

In [34]:
print("String".startswith("S"))
print("String".startswith("s"))
print("String".endswith("g"))
print("String".endswith("z"))

True
False
True
False


#### 📌 zfill()

In [35]:
print("123".zfill(10))

0000000123


## 🗂️ 문자열 서식(String Format)

#### 📌 문자열 포맷팅(Stirng Formatting)
- 문자열 내에서 서식에 맞추어 특정 값을 삽입 또는 변경
- 기호 ```%``` 뒤에 있는 값이 문자열 내의 서식에 순서대로 매핑

In [36]:
print("나는 사과가 %d개 있다" % 2)
print("나는 %s가 %d개 있다" % ("사과", 2))

나는 사과가 2개 있다
나는 사과가 2개 있다


#### 📌 문자열 포맷 코드(String Format Code)
- 문자열 포맷팅에서 사용할 수 있는 다양한 포맷 코드

|코드|설명|
|:--:|:--:|
|%s|문자열(string)|
|%c|문자(character)|
|%d|정수(integer)|
|%f|부동소수(floating-point)|
|%o|8진수(octal)|
|%x|16진수(hexadecimal)|
|%%|문자 '%'|

#### 📌 정렬, 공백, 소수점 포맷
- ```.``` 앞의 숫자는 길이를 의미
- ```.``` 뒤의 숫자는 소수점 이하의 개수를 의미
- ```-```는 왼쪽 정렬을 의미

In [37]:
print("'" + "%10.2f" % 1.2345 + "'")
print("'" + "%-10.2f" % 1.2345 + "'")

'      1.23'
'1.23      '


#### 📌 문자열 format 메소드
- 문자열 ```format()```의 인덱스를 이용한 고급 포맷팅
- 인덱스에 따라 ```format()``` 함수의 각 값들이 매핑

In [38]:
print("나는 사과가 {0}개 있다".format(2))
print("나는 {0}가 {1}개 있다".format("사과", 2))

fruit = "바나나"
count = 5
print("나는 {0}가 {1}개 있다".format(fruit, count))

print("나는 {fruit}가 {count}개 있다.".format(count = 10, fruit = "포도"))

나는 사과가 2개 있다
나는 사과가 2개 있다
나는 바나나가 5개 있다
나는 포도가 10개 있다.


- 문자열 ```format()``` 함수의 정렬, 공백, 소수점 표현

|포맷|설명|
|:--:|:--:|
|:9|길이 9|
|:<|왼쪽 정렬|
|:>|오른쪽 정렬|
|:^|가운데 정렬|
|:~|'~'로 공백 채우기|
|:0.2f|소수점을 2자리까지 표현|
|:10.2f|길이 10, 소수점 2자리|
|{{|'{' 문자 표현|
|}}|'}' 문자 표현|

In [39]:
print("'" + "{0:9}".format("Hello") + "'")
print("'" + "{0:<9}".format("Hello") + "'")
print("'" + "{0:>9}".format("Hello") + "'")
print("'" + "{0:^9}".format("Hello") + "'")
print("'" + "{0:~^9}".format("Hello") + "'")
print("'" + "{0:-^9}".format("Hello") + "'")
print("'" + "{0:0.2f}".format(3.1415925635) + "'")
print("'" + "{0:10.2f}".format(3.1415925635) + "'")
print("{{중괄호}}".format())

'Hello    '
'Hello    '
'    Hello'
'  Hello  '
'~~Hello~~'
'--Hello--'
'3.14'
'      3.14'
{중괄호}


#### 📌 f 문자열 포맷팅
- 문자열 포맷팅을 위해서 새롭게 나온 기능으로 문자열 앞에 f를 붙여서 구분

In [40]:
fruit = "사과"
count = 2
print(f"나는 {fruit}가 {count}개 있다")

나는 사과가 2개 있다


- 기존의 문자열 포맷을 문자열 다음기호 ```:``` 뒤에 표현하여 그대로 사용 가능

In [41]:
print("'" + f"{'Hello':9}" + "'")
print("'" + f"{'Hello':<9}" + "'")
print("'" + f"{'Hello':>9}" + "'")
print("'" + f"{'Hello':^9}" + "'")
print("'" + f"{'Hello':~^9}" + "'")
print("'" + f"{'Hello':-^9}" + "'")
print("'" + f"{3.1415925635:0.2f}" + "'")
print("'" + f"{3.1415925635:10.2f}" + "'")
print(f'{{중괄호}}')

'Hello    '
'Hello    '
'    Hello'
'  Hello  '
'~~Hello~~'
'--Hello--'
'3.14'
'      3.14'
{중괄호}
