# 1. 파이썬 내장 자료형  :  Compound 

- 여러 원소를 가진 자료형
- 문자열, 튜플, 리스트, 딕셔너리 등이 있다. 

## 1-1 문자열

- 문자열에는 bytes, str 2개가 있다.
- bytes는 ascii 코드의 값으로 처리
- str은 유니코드의 값으로 처리 -> 한글 등 다양한 언어 처리

## 1-1-1 문자열 알아보기

-  문자열과 바이트 문자열은 한번 생성하면 내부의 값을 변경할 수 없다.
- 대신 다양한 메서드를 제공해서 새로운 문자열로 변경한 결과를 만들어준다.

### 문자열 리터럴 작성

- 따옴표를 사용해서 문자열을 작성한다.
- 바이트 문자열인 경우는 문자열 앞에 b를 붙인다 

In [1]:
ss = "문자열"
bb = b"abc"           # 바이트 문자열(bytes) 

In [2]:
len(ss), len(bb)

(3, 3)

In [3]:
type(ss), type(bb)    # 자료형 확인 

(str, bytes)

### 문자열에서 바이트 문자열로 변환

- encode 메서드는 문자열을 바이트문자여로 변환
- decode 메서드는 바이트 문자열에서 문자열로 변환

In [4]:
ss.encode()

b'\xeb\xac\xb8\xec\x9e\x90\xec\x97\xb4'

b'\xeb\xac\xb8\xec\x9e\x90\xec\x97\xb4'

In [None]:
len(ss.encode())

9

In [None]:
ss.encode().decode()

In [7]:
len(ss.encode().decode())

### 여러줄 문자열을 사용도 가능

- 큰 따옴표나 작은 따옴표를 쌍으로 3개 사용한다. 


In [1]:
sss = """
def add(x,y) :
    return x+y
"""

In [2]:
print(sss)


def add(x,y) :
    return x+y



### 파이썬은 인터프리터 특징
- 즉시 문자열로 작성한 문장을 실행하면 문장이 로딩된다.
- 그래서 로딩된 함수를 실행하면 값을 반환한다.

In [7]:
exec(sss)             ## 여러줄로 작성된 문자열이 파이썬 함수이므로
                      ## 이 함수를 실행해서 로딩한다. 

In [10]:
add(100,2)            ## 함수를 호출해서 확인한다. 

102

## 1-1-2 문자열 내의 원소 및 부분 검색 처리 

- 인덱스 검색 : 대괄호 기호를 사용하고 인덱스를 전달해서 하나의 값을 검색
- 슬라이스는 시작과 종료점을 지정해서 특정 부분을 검색

## 여러 원소를 가진 문자열의 원소를 조회하는 방법

- 인덱스 검색  : 하나의 원소 검색  대괄호에 정수 사용
- 슬라이스 검색 : 여러 원소를 검색, 대괄호에 슬라이스 사용(인덱스: 인덱스)

### 인덱스 검색 

- 하나의 값만 검색
- 인덱스 범위를 벗어나면 예외처리 되므로 항상 범위 내의 원소만 검색해야 함 

In [12]:
ss = "가을이라 가을바람"

In [13]:
ss[0]    # 하나의 요소를 선택하기 

'가'

### 슬리이스 검색
- 슬라이스는 시작점과 종료점을 지정해서 부분검색

In [14]:
ss[1:2]  # 여러개 요소를 선택하기 : 슬라이스 처리 

'을'

In [17]:
sl1 = slice(1,2)
print(ss[sl1])

을


### 슬리아스 검색 모든 것을 다 검색할 때는 콜론만 처리

In [18]:
ss[:]

'가을이라 가을바람'

## 1-1-3  순환문 처리하기 

- 다양한 요소를 가지는 복합 자료형은 순환문으로 내부의 요소를 처리할 수 있다.
- for 순환문은 다양한 원소를 가진 경우만 실행이 된다. 
- while 순환문은 특정 조건에 따라 순환된다.
- 순환문을 제어할 때는 break, continue를 작성해서 중단하거나 처리를 제외해야 한다.

### 일반적인 숫자를 순환처리

- range를 사용해서 순환문으로 처리
- range(start, end, step) 으로 숫자의 범위를 만든다.

In [11]:
for i in range(0, 10) :
    print(i, end=", ")

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 

In [12]:
for i in range(10) :
    print(i, end=", ")

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 

### 문자열을 순환해서 처리하기

In [13]:
sss="가나다라마바사"

In [14]:
for i in sss:
    print(i)

가
나
다
라
마
바
사


### 문자열 내부의 메서드 확인하기 1

- 스페셜 메서드는 파이썬 내부적으로 처리하는 메서드를 만들어서 제공한다.
- 보통 이 스페셜 메서드에는 연산자 등이 있다. 

In [15]:
for i in dir(ss) :
    if i.startswith("_") :
        print(i,end=", ")

__add__, __class__, __contains__, __delattr__, __dir__, __doc__, __eq__, __format__, __ge__, __getattribute__, __getitem__, __getnewargs__, __gt__, __hash__, __init__, __init_subclass__, __iter__, __le__, __len__, __lt__, __mod__, __mul__, __ne__, __new__, __reduce__, __reduce_ex__, __repr__, __rmod__, __rmul__, __setattr__, __sizeof__, __str__, __subclasshook__, 

### 문자열 내부의 메서드 확인하기 2

- 보통 사용하는 메서드

In [16]:
for i in dir(ss) :
    if not i.startswith("_") :
        print(i,end=", ")

capitalize, casefold, center, count, encode, endswith, expandtabs, find, format, format_map, index, isalnum, isalpha, isascii, isdecimal, isdigit, isidentifier, islower, isnumeric, isprintable, isspace, istitle, isupper, join, ljust, lower, lstrip, maketrans, partition, removeprefix, removesuffix, replace, rfind, rindex, rjust, rpartition, rsplit, rstrip, split, splitlines, startswith, strip, swapcase, title, translate, upper, zfill, 

### 문자열 메서드 :  문자열 분리하기

In [17]:
sst = "문자열 분리하기".split()

In [18]:
sst

['문자열', '분리하기']

In [19]:
sst1 = "쉼표,단위로,분리하기".split(",")

In [20]:
sst1

['쉼표', '단위로', '분리하기']

## 1-2 튜플

- 튜플은 여러 요소를 가지는 하나의 자료구조이다.
- 튜플은 한번 생기면  요소를 수정하거나 삭제할 수 없다. 

## 1-2-1 튜플을 정의해서 처리하기 

### 튜플을 생성하기

In [21]:
t0 = ()           # 아무 요소가 없는 튜플

In [1]:
t1 = (100,)       # 하나의 요소를 가지는 튜플

In [2]:
t = (100,200)     # 두 개의 요소를 가지는 튜플
for i in t :
    print(i)

100
200


### 튜플 클래스로 변환해서 생성하기

In [3]:
lts = tuple([1,2,3,4])

In [4]:
lts

(1, 2, 3, 4)

### 튜플의 요소 개수 확인

In [5]:
t3 = (100,200,300)

In [6]:
len(t3)

3

## 1-2-2 인덱스 검색이나 슬라이스 검색을 통해 요소 조회

### 인덱스 검색하기

In [7]:
d = t3[0]

In [8]:
d

100

### 슬라이스 검색하기

In [9]:
se = t3[1:2]

In [10]:
se

(200,)

### 튜플 내부의 메서드 확인 

- 튜플 내부에는 인덱스와 개수만 확인하는 메서드만 있다. 
- 튜플의 원소를 갱신하거나 수정할 수 있는 메서드가 없어서 한번 만들어지면 변경할 수 없다. 

In [11]:
for i in dir(t3) :
    if not i.startswith("_") :
        print(i,end=", ")

count, index, 

## 1-2-3 튜플을 구조분해해서 변수에 할당하기
- 튜플의 요소를 바로 변수에 할당해서 분해 가능 

In [12]:
a,b,c = t3

In [13]:
print(a,b,c)

100 200 300


## 1-3 리스트

- 리스트는 내부의 원소를 변경, 추가, 삭제가 가능한 복합 자료형이다.
- 일반적인 배열 처럼 하나의 자료형으로 리스트를 만든다.
- 다양한 자료형이 들어갈 경우는 최상위 자료형인 object로 구성된 것이다

## 1-3-1 리스트 생성

### 리터럴로 리스트 생성 

In [14]:
l0 = []   # 요소가 아무것도 없는 리스트

In [15]:
l1 = [1,]  # 하나의 요소를 가진 리스트

### 클래스로 리스트 생성 

- 보통 리스트 클래스로 생성할 경우는 튜플이나 문자열 등을 넣어서 생성
- 다른 자료형을 리스트로 변환하는 것과 같다

In [16]:
cl = list((1,2,3,4))

In [17]:
cl

[1, 2, 3, 4]

In [18]:
cls = list("가나다라")

In [19]:
cls

['가', '나', '다', '라']

## 1-3-2 리스트 검색 및 부분 검색

- 인덱스는 순방향 : 인덱스 값이 0부터 양수
- 인덱스 역방향 : 인덱스값이 -1부터 시작

In [20]:
li_10 = list(range(10))

In [21]:
li_10

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### 인덱스로 하나의 값을 조회

In [22]:
li_10[0]

0

### 마지막 값을 조회하기

- 인덱스를 음수로 사용해서 역방향으로 조회도 가능하다

In [23]:
li_10[len(li_10) -1]

9

In [24]:
li_10[-1]

9

### 슬리이스 검색

In [25]:
li_10[2:]

[2, 3, 4, 5, 6, 7, 8, 9]

### 역방향으로 슬라이스 검색하기

In [26]:
li_10[-1:-11:-1]

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

## 1-3-3  리스트 내의 메서드 확인하기

In [27]:
for i in dir(l0) :
    if not i.startswith("_") :
        print(i,end=", ")

append, clear, copy, count, extend, index, insert, pop, remove, reverse, sort, 

### 리스트의 맨뒤에 요소를 추가하기

In [28]:
lll = []

for i in range(10) :
    lll.append(i)

In [29]:
len(lll)                     # 리스트의 원소 개수 확인하기

10

### 다른 리스트의 요소를 전부 추가하기

In [30]:
lll.extend(lll)

In [31]:
lll

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

## 1-4 집합

- 집합에는 변경가능한 집합 set 과 변경이 불가능한 집합 frozenset이 있다.
- 변경 불가능한 집합이 필요한 이유는 한번 생성하면 변경되지 않아야 하는 곳에 사용이 가능하다. 주로 딕셔너리 키로 사용이 가능하다.

## 1-4-1 변경가능한 집합 

In [32]:
ss0 = set()

In [33]:
ss1 = {1}

In [34]:
for i in dir(ss0) :
    if not i.startswith("_") :
        print(i,end=", ")

add, clear, copy, difference, difference_update, discard, intersection, intersection_update, isdisjoint, issubset, issuperset, pop, remove, symmetric_difference, symmetric_difference_update, union, update, 

## 1-4-2 변경 불가능한 집합 

In [35]:
fs0 = frozenset()

In [36]:
fs1 = frozenset([100])        # 튜플, 리스트 등으로 인자를 전달해야 함 

In [37]:
for i in dir(fs0) :
    if not i.startswith("_") :
        print(i,end=", ")

copy, difference, intersection, isdisjoint, issubset, issuperset, symmetric_difference, union, 

## 1-5 딕셔너리

- 모든 요소는 키와 값으로 구성한다.
- 키는 항상 변경이 불가능한 자료형으로 구성되어야 한다.
- 보통 키는 숫자, 문자열, 튜플 등으로 구성한다.

## 1-5-1 딕셔너리 생성 

### 리터럴로 딕셔너리 생성

In [38]:
dd0 = {}

In [39]:
dd1 = {"a":100}

### 키와 값을 쌍으로 만들어서 객체 생성

- 두 개의 리스트를 zip을 사용해서 두 개의 요소를 가진 튜플로 묶은 리스트를 만든다.

In [40]:
ll = [1,2,3,4,]
ss = list("abcd")

In [41]:
llss = [*zip(ll,ss)]

In [42]:
dd = dict(llss)

In [43]:
dd

{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

## 1-5-2 딕셔너리 메서드 사용

In [44]:
for i in dir(dd0) :
    if not i.startswith("_") :
        print(i,end=", ")

clear, copy, fromkeys, get, items, keys, pop, popitem, setdefault, update, values, 

## 2. 컴프리헨션 

- 리스트, 집합, 딕셔너리의 요소들을 나열하지 않고 축약으로 표기하는 법 
- 많은 요소를 가질 경우 이 방식을 사용해서 표기해서 사용

## 2-1 리스트 컴프리헨션 

### 리스트에 요소를 추가하기

In [45]:
llll = [] 
for i in range(100) :
    llll.append(i)

In [46]:
len(llll)

100

### 컴프리헨션으로 바로 요소 추가하기

In [47]:
l100 = [i for i in range(100)]

In [48]:
len(l100)

100

In [49]:
l100[:10]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### 특정값을 필터링해서 요소 추가하기

In [50]:
llll = [] 
for i in range(100) :
    if i % 2 == 0 :
        llll.append(i)

In [51]:
len(llll)

50

### 컴프리헨션에서 가드를 사용해서 필터링하기 

In [52]:
l50 = [i for i in range(100) if i % 2 == 0]

In [53]:
len(l50)

50

## 2-2 집합 컴프리헨션 

### 집합인 경우도 가능


In [54]:
s100 = {i for i in range(100)}

In [55]:
len(s100)

100

## 2-3 딕셔너리 컴프리헨션 

### 키와 값을 처리하는 부분이 집합과 다르다.

- enumerate 함수는 인덱스와 값을 반환한다.
- 그래서 두개의 변수로 분리해서 처리

In [56]:
dd100 = {i:v for i,v in enumerate(range(100))}

In [57]:
len(dd100)

100

### 키의 원소만 추출하기

In [58]:
keys = dd100.keys()

In [59]:
keys

dict_keys([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

### 특정 값만 가드를 사용해서 필터링하기

In [60]:
{k: dd100[k] for k in keys if k < 10 }

{0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9}

### 딕셔너리의 값만 가져오기

In [61]:
dd100.values()

dict_values([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

### 딕셔너리의 키와 값의 순서쌍을 출력하기 

In [62]:
dd100.items()

dict_items([(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6), (7, 7), (8, 8), (9, 9), (10, 10), (11, 11), (12, 12), (13, 13), (14, 14), (15, 15), (16, 16), (17, 17), (18, 18), (19, 19), (20, 20), (21, 21), (22, 22), (23, 23), (24, 24), (25, 25), (26, 26), (27, 27), (28, 28), (29, 29), (30, 30), (31, 31), (32, 32), (33, 33), (34, 34), (35, 35), (36, 36), (37, 37), (38, 38), (39, 39), (40, 40), (41, 41), (42, 42), (43, 43), (44, 44), (45, 45), (46, 46), (47, 47), (48, 48), (49, 49), (50, 50), (51, 51), (52, 52), (53, 53), (54, 54), (55, 55), (56, 56), (57, 57), (58, 58), (59, 59), (60, 60), (61, 61), (62, 62), (63, 63), (64, 64), (65, 65), (66, 66), (67, 67), (68, 68), (69, 69), (70, 70), (71, 71), (72, 72), (73, 73), (74, 74), (75, 75), (76, 76), (77, 77), (78, 78), (79, 79), (80, 80), (81, 81), (82, 82), (83, 83), (84, 84), (85, 85), (86, 86), (87, 87), (88, 88), (89, 89), (90, 90), (91, 91), (92, 92), (93, 93), (94, 94), (95, 95), (96, 96), (97, 97), (98, 98), (99, 99)])