## 파이썬의 타입

- 숫자:
  - 정수(int)
  - 실수(float)
- 문자열(str)
- 불리안(bool)

# 문자열(String)

- 작은 따옴표와 큰 따옴표로 감싸져 있는 값
- "abc", 'Hello'
- fstring : f"abc"
- raw string : r"abc" # == 문자열을 그대로 출력
- multiline string : """abc""", '''abc'''

## 문자열 상수

- ascii 코드
- 공백
- 숫자
- 특수부호

In [2]:
import string # 내장힘수는 import 없이 사용할 수 있지만, 항상 사용하지 않지만 유용한 모듈은 import 해서 활용

In [3]:
print(string.ascii_letters)

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ


In [4]:
print(string.digits)

0123456789


In [5]:
int("3")

3

In [7]:
float("3.14")

3.14

In [8]:
print(string.hexdigits)

0123456789abcdefABCDEF


In [10]:
print(string.octdigits)

01234567


In [12]:
string.whitespace # whitespace : 공백

' \t\n\r\x0b\x0c'

In [13]:
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

## Escaping

키보드에 없거나 또는 모니터에 출력할 수 없는 것들을 표현하기 위해서

- \n : 줄바꿈
- \t : 탭
- \b : backspace
- "
- '

In [14]:
# " 따옴표 하나만 출력하고 싶을 때
print("\"") # Error : print(""")

"


In [15]:
print("\'")

'


In [16]:
print("a\tb") # b 포함 8글자 공백

a	b


In [17]:
print("a\nb")

a
b


In [18]:
# file path를 escaping 없이 적는다면 의도하지 않은 대로 표현된다.
print("c\\some\path\name")

c\some\path
ame


In [19]:
print(r"c\some\path\name")

c\some\path\name


## 멀티라인 문자열

- """""", ''''''
- 여러줄에 걸친 문자열을 표현하고 싶다면
- 함수의 설명 : docstring
- Enter/tab 과 같은 공백도 인식한다.

In [21]:
print("""
  1. 오늘 할일.
      2. 내일 할일
          3. 하지말아야할 일
""")


  1. 오늘 할일.
      2. 내일 할일
          3. 하지말아야할 일



In [22]:
help(sum) # doctstring

Help on built-in function sum in module builtins:

sum(iterable, start=0, /)
    Return the sum of a 'start' value (default: 0) plus an iterable of numbers
    
    When the iterable is empty, return the start value.
    This function is intended specifically for use with numeric values and may
    reject non-numeric types.



## 문자열 연산

- 덧셈 : 문자열을 이어붙이는 것과 같다, concatenate
- 곱셈 : 덧셈의 반복, n번 이어 붙이는 것
- 포함(in)
- 비교

In [23]:
"Hello" + "World"

'HelloWorld'

In [24]:
"Hello" + "3"

'Hello3'

In [25]:
"Hello" * 3

'HelloHelloHello'

In [26]:
"Hello" + "Hello" + "Hello"

'HelloHelloHello'

In [27]:
"Hello" * 0

''

In [28]:
"H" in "Hello"

True

In [29]:
"F" in "Hello"

False

In [30]:
"Fe" in "Hello"

False

In [31]:
"H" not in "Hello"

False

In [32]:
"Hello" == "Hello"

True

In [33]:
"Fello" == "Hello"

False

## 문자열 인덱싱

문자열은 한개 이상의 문자로 이루어져있기 때문에 인덱싱을 지원한다.

- 문자열의 구성요소에 접근
- [n] : dict 형식의 표현, n + 1 번째의 문자

In [35]:
my_str = "Python3"
my_str

'Python3'

In [36]:
my_str[2]

't'

In [37]:
my_str[0] # 첫번째

'P'

In [38]:
my_str[-1] # 마지막

'3'

In [39]:
n = 2
my_str[n]

't'

In [40]:
len(my_str)

7

In [41]:
# 길이를 넘어가면 IndexError
try:
    my_str[10]
except IndexError:
    print("IndexError")

IndexError


In [42]:
my_str[6]

'3'

In [43]:
# len() 결과를 넣어도 IndexError
try:
    my_str[7]
except IndexError:
    print("IndexError")

IndexError


In [44]:
# 안티패턴을 사용하지말고 반드시 [-1]로 접근한다.

## 문자열의 슬라이싱(Slicing)

- [start:end]
- [start:end:step]

In [45]:
my_str

'Python3'

In [47]:
my_str[1:3] # 2 번째부터 3 번째 문자까지 == 인덱스 1부터 인덱스 2까지

'yt'

In [48]:
# 2 번째 == 인덱스 1
# 3 번째 == 인덱스 2

In [50]:
my_str[:3]

'Pyt'

In [51]:
my_str[0:3] # 0을 표현하는 것은 지양, == my_str[:3]

'Pyt'

In [52]:
my_str[3:]

'hon3'

In [53]:
my_str[::2] # range()의 step arg와 비슷함.

'Pto3'

In [54]:
my_str[::3]

'Ph3'

## 문자열의 길이

- len

In [55]:
len(my_str)

7

In [56]:
my_str3 = "   Python 2.73   "

In [57]:
len(my_str3)

17

## 문자열의 메소드

- 문자열이 제공하는 기능/함수
- dir(str)로 메소드함수 확인
  - 문자 찾기
  - 접두사와 접미사
  - 문자열 변경
  - 공백 제거하기
  - 문자열의 포맷팅

### 문자 찾기

- str.find(c)
- str.count(sub)
- str.index(sub)

In [58]:
my_str

'Python3'

In [59]:
my_str.find('n')

5

In [61]:
my_str.find("on") # 결과값은 index

4

In [62]:
my_str.find("Cy") # 없다면, 못 찾았다는 의미에서 -1 을 반환

-1

In [63]:
"accbcc".find("c") # 여러 값이 있다면, 가장 첫번째로 찾은 값의 index가 나온다.

1

In [64]:
 my_str.count('n')

1

In [65]:
my_str.count('Py')

1

In [66]:
"accbbabab".count('a')

3

In [67]:
"accbbabab".count('ac')

1

In [69]:
my_str.index("n") # index 도 find 와 같이 결과값으로 index 반환

5

In [71]:
# index 와 find 의 차이점 : 못 찾을 시, ValueError를 반환
my_str.index("Cy") # .find("Cy") => -1

ValueError: ignored

## 접두사와 접미사

- startswith
- endswith

In [72]:
my_str.startswith("P")

True

In [73]:
my_str.startswith("Py")

True

In [74]:
my_str.endswith("on3")

True

In [75]:
my_str.endswith("on2")

False

## 문자열 변경하기

- upper : 소문자 -> 대문자
- lower : 대문자 -> 소문자
- replace(pat, repl) : 특정문자 변경하기

In [77]:
my_str1 = "heLLo, World"
my_str1

'heLLo, World'

In [78]:
my_str1.lower()

'hello, world'

In [79]:
my_str1.upper()

'HELLO, WORLD'

In [81]:
# 용도 : 대소문자 상관없이 어떤 문자를 찾는데 사용됨.
'l' in my_str1 # 'L'

True

In [82]:
'l'.lower() in my_str.lower() # == 'l'.upper() in my_str.upper()

False

In [83]:
my_str1.replace('L', 'l') # 하나만 변경하는 것이 아닌, 안에 있는 모든 'L'을 변경한다.

'hello, World'

In [84]:
my_str1.replace('L', 'l', 1) # 숫자를 추가하여, 몇 번 변경할 지 정할 수 있다.

'helLo, World'

In [85]:
my_str1.replace('L', 'l', 2)

'hello, World'

## 공백 제거하기

- strip
- rstrip
- lstrip

In [86]:
my_str2 = "       Pyth  on        "
my_str2

'       Pyth  on        '

In [87]:
my_str2.strip()

'Pyth  on'

In [88]:
my_str2.lstrip()

'Pyth  on        '

In [89]:
my_str2.rstrip()

'       Pyth  on'

In [90]:
my_str2.lstrip().rstrip() ## == my_str2.strip()

'Pyth  on'

## vs. replace

1. 띄어쓰기도 사라진다.
1. 공백을 지정해줘야한다. (물론 정규식으로 지정할 수 있다.)

In [91]:
my_str2.replace(" ", "")

'Python'

In [94]:
my_str2 = "       Py      \n.   thon\t"
my_str2

'       Py      \n.   thon\t'

In [95]:
my_str.replace(" ", "").replace("\n", "")

'Python3'

## 문자열 나누기

- split(sep)

In [96]:
my_str3 = "My name is iron man"
my_str3

'My name is iron man'

In [97]:
# split 은 기본적으로 띄어쓰기로 나누어져 있는 문자열을 나누는데 특화되어있다.
my_str3.split()

['My', 'name', 'is', 'iron', 'man']

In [98]:
# 다른 패턴에도 적용할 수 있다.
my_str4 = "Lion,Hippo,Eagle,Tiger"
my_str4

'Lion,Hippo,Eagle,Tiger'

In [99]:
my_str4.split(",")

['Lion', 'Hippo', 'Eagle', 'Tiger']

In [100]:
my_str5 = "Lion:Hippo:Eagle:Tiger"
my_str5

'Lion:Hippo:Eagle:Tiger'

In [101]:
my_str5.split(":")

['Lion', 'Hippo', 'Eagle', 'Tiger']