# 순서가 있는 데이터 구조
- 문자열(stirng)
- 리스트(list)

# 순서가 없는 데이터 구조
- 세트(set)
- 딕셔너리(dictionary)

# 문자열(String)

## 문자들의 나열(sequence of characters)

## 문자열의 특징
- 변경할 수 없고(immutable)
- 순서가 있고(ordered)
- 순회 가능한(iterable)

In [1]:
# immutable
sentence = 'my string?'
sentence[-1] = '!'

TypeError: 'str' object does not support item assignment

In [2]:
# iterable
sentence = 'my string?'
for s in sentence:
    print(s, end=' ')

m y   s t r i n g ? 

## 문자열 인덱스(Index)
- 파이썬에서 문자열은 아래와 같이 접근할 수 있다.
> ' a  b  c'
>
>   0  1  2
>
>  -3 -2 -1

## 문자열 자르기(Slicing)
- 파이썬에서 문자열은 아래와 같이 자를 수 있다.
> string[start:stop:step]

In [3]:
sentence = 'abcdefghij'
# index2부터 index4까지
sentence[2:5]

'cde'

In [4]:
# index-6부터 index-3까지
sentence[-6:-2]

'efgh'

In [5]:
# index2부터 index-5까지
sentence[2:-4]

'cdef'

In [6]:
# index2부터 index4까지 2칸씩
sentence[2:5:2]

'ce'

In [7]:
# index-6부터 index-3까지 3칸씩
sentence[-6:-2:3]

'eh'

In [8]:
# 처음부터 index2까지
print(sentence[:3])
# index5부터 끝까지
print(sentence[5:])

abc
fghij


In [9]:
# 처음부터 끝까지
print(sentence[::])     # sentence[0:len(sentence):1]과 동일
# 처음부터 끝까지 역순으로
print(sentence[::-1])   # sentence[-1:-(len(sentence)+1):-1]과 동일

abcdefghij
jihgfedcba


## 문자열의 나열(sequence of characters)

## 문자열의 특징
- 변경할 수 없고(immutable)
- 순서가 있고(ordered)
- 순회 가능한(iterable)

## 문자열 조회/탐색
> **.find(x)**
- x의 첫 번째 위치를 반환. 없으면, -1을 반환.

In [11]:
print('apple'.find('p'))

1


In [12]:
print('apple'.find('k'))

-1


## 문자열 조회/탐색
> **.index(x)**
- x의 첫 번째 위치를 반환. 없으면, 오류발생.

In [13]:
print('apple'.index('p'))

1


In [14]:
print('apple'.index('k'))

ValueError: substring not found

## 문자열 변경
> **.replace(old, new[, count])**
- 바꿀 대상 글자를 새로운 글자로 바꿔서 반환
- 선택적 인자 count를 지정하면, 해당 개수만큼만 시행

### 배커스-나우르 표기법
- [] : 선택적 인자, optional

In [15]:
'aoole'.replace('o', 'p')

'apple'

In [16]:
'ayyly'.replace('y', 'p', 2)

'apply'

## 문자열 변경
> **strip([chars])**
- 양쪽을 제거하거나(strip), 왼쪽을 제거하거나(lstrip), 오른쪽을 제거하거나(rstrip)
- 문자열을 지정하지 않으면 공백을 제거

In [17]:
'   wow!\n'.strip()

'wow!'

In [18]:
'   wow!\n'.lstrip()

'wow!\n'

In [19]:
'   wow!\n'.rstrip()

'   wow!'

In [20]:
print('hello????'.strip('?'))
print('hello????'.lstrip('?'))
print('hello????'.rstrip('?'))

hello
hello????
hello


## 문자열 변경
> **.split(chars)**
- 문자열을 특정한 단위로 나눠 리스트로 반환

In [21]:
'a,b,c'.split('-')

['a,b,c']

In [22]:
'a,b,c'.split(',')

['a', 'b', 'c']

## 문자열 변경
> **'separator'.join(iterable)**
- 반복가능한(iterable) 컨테이너 요소들을 구분자(separator)로 합쳐 문자열 반환

In [30]:
'!'.join('34')

'3!4'

In [31]:
' '.join('hello')

'h e l l o'

## 문자열 변경
> **.capitalize() : 앞글자만 대문자로**
>
> **.title() : '나 공백 이후를 대문자로**
>
> **.upper() : 모두 대문자로**
>
> **.lower() : 모두 소문자로**
>
> **.swapcase() : 대<->소문자로 변경**

In [35]:
msg = 'hI! Everyone, I\'m kim'
print(msg)
print('capitalize()', msg.capitalize(), sep=' : ')
print('title()', msg.title(), sep=' : ')
print('upper()', msg.upper(), sep=' : ')
print('lower()', msg.lower(), sep=' : ')
print('swapcase()', msg.swapcase(), sep=' : ')

hI! Everyone, I'm kim
capitalize() : Hi! everyone, i'm kim
title() : Hi! Everyone, I'M Kim
upper() : HI! EVERYONE, I'M KIM
lower() : hi! everyone, i'm kim
swapcase() : Hi! eVERYONE, i'M KIM


## 문자열 관련 검증 메소드
> **.isalpha() : 알파벳 문자 여부**
> - 단순 알파벳이 아닌 유니코드 상 Letter(한국어도 포함)
>
> **.isupper() : 대문자 여부**
>
> **.islower() : 소문자 여부**
>
> **.istitle() : 타이틀 형식 여부**

In [38]:
print("'abc'.isalpha()", 'abc'.isalpha(), sep=' : ')
print("'ㄱㄴㄷ'.isalpha()", 'ㄱㄴㄷ'.isalpha(), sep=' : ')
print("'Abc'.isupper()", 'Abc'.isupper(), sep=' : ')
print("'abc'.islower()", 'abc'.islower(), sep=' : ')
print("'Title Title!'.istitle()", 'Title Title!'.istitle(), sep=' : ')

'abc'.isalpha() : True
'ㄱㄴㄷ'.isalpha() : True
'Abc'.isupper() : False
'abc'.islower() : True
'Title Title!'.istitle() : True


## 문자열 관련 검증 메소드
> **.isdecimal() <= .isdigit() <= .isnumeric()**
- isdecimal() 함수는 주어진 문자열이 int형으로 변환이 가능한지 알아내는 함수이기 때문에 특수문자 중 숫자모양을 숫자로 치지 않는다
- isdigit() 함수는 단일 글자가 '숫자' 모양으로 생겼으면 무조건 True를 반환하는 함수. 즉, 숫자처럼 생긴 '모든 글자'를 숫자로 친다.
- isnumeric() 함수는 숫자값 표현에 해당하는 문자열까지 인정한다. 제곱근 및 분수, 거듭제곱 특수문자도 isnumeric() 함수는 True를 반환하는 것을 알 수 있다.

In [40]:
print("'3²'.isdecimal()", '3²'.isdecimal(), sep=' : ')
print("'3²'.isdigit()", '3²'.isdigit(), sep=' : ')
print("'3²'.isnumeric()", '3²'.isnumeric(), sep=' : ')

'3²'.isdecimal() : False
'3²'.isdigit() : True
'3²'.isnumeric() : True


In [41]:
print("'⑨④'.isdecimal()", '⑨④'.isdecimal(), sep=' : ')
print("'⑨④'.isdigit()", '⑨④'.isdigit(), sep=' : ')
print("'⑨④'.isnumeric()", '⑨④'.isnumeric(), sep=' : ')

'⑨④'.isdecimal() : False
'⑨④'.isdigit() : True
'⑨④'.isnumeric() : True


In [42]:
print("'½'.isdecimal()", '½'.isdecimal(), sep=' : ')
print("'½'.isdigit()", '½'.isdigit(), sep=' : ')
print("'½'.isnumeric()", '½'.isnumeric(), sep=' : ')

'½'.isdecimal() : False
'½'.isdigit() : False
'½'.isnumeric() : True
