# 1. 시퀀스 자료형

### - 여러 개의 원소를 가진 자료형을 말한다.
### - 문자열, 리스트, 튜플 등이 있다.


## 컬렉션 모듈에 시퀀스 클래스에 대한 추상 클래스가 있다.

In [2]:
import collections as cols

### 추상 클래스를 상속했다면 아래의 두 메소드를 반드시 구현해야 한다.

In [4]:
cols.abc.Sequence.__abstractmethods__

frozenset({'__getitem__', '__len__'})

## 내장 클래스가 추상클래스를 구현했는지 확인

- 상속관계가 성립하는지 확인한다.

In [5]:
issubclass(str, cols.abc.Sequence)

True

In [6]:
issubclass(list, cols.abc.Sequence)

True

In [7]:
issubclass(tuple, cols.abc.Sequence)

True

##  문자열 리터럴 표기법

- 문자열은 따옴표 사이에 들어가는는 유니코드 :str 클래스
- 바이트 문자열도 따옴표 사이에 들어가지만 보통 아스키코드 문자들이 들어가고 따옴표 앞에 b를 붙임 :  bytes 클래스


In [1]:
"문자열"

'문자열'

In [2]:
b'abc'

b'abc'

In [3]:
type("문자열"), type(b'abc')

(str, bytes)

### 문자처리 함수

- 문자를 숫자로 변환하거나 숫자를 문자로 변환
- 실제 파이썬은 모든 것을 문자열로 처리하므로 별도의 문자 자료형은 없다.

In [4]:
ord("a")

97

In [5]:
chr(97)

'a'

## 표준입력 처리

- 키보드로 입력을 받아서 처리하는 함수 : input

In [6]:
s = input(" 숫자를 입력하세요 ")

 숫자를 입력하세요 1


In [7]:
type(s)

str

In [8]:
i = int(input(" 숫자를 입력하세요 "))

 숫자를 입력하세요 9


In [9]:
type(i)

int

### 두 수를 입력해서 곱하시요

In [10]:
%%writefile input.py

if __name__ == "__main__" : 
    
    i1 = int(input(" 첫번째 숫자를 입력하세요 "))
    i2 = int(input(" 두번째 숫자를 입력하세요 "))
    print("-" * 50)
    for i in range(i1,i2) :
        print(i)

Overwriting input.py


In [11]:
%run input.py

 첫번째 숫자를 입력하세요 1
 두번째 숫자를 입력하세요 3
--------------------------------------------------
1
2


## 파이썬 모듈 이해하기

### - 다양한 함수와 클래스를 모듈 단위로 관리한다.

- 파이썬에는 메인 함수나 메소드가 존재하지 않는다.
- 대신 모듈을 실행하면 이름을 __main__ 으로 바꾼다.
- import 하는 모듈의 이름은 변경되지 않는다

### 모듈에는 이름을 가진다. 
- 속성 __name__에 모듈의 이름을 관리

In [None]:
### 현재 모듈 내에 가진 변수 등을 확인한다. 

In [8]:
dir()

['In',
 'Out',
 '_',
 '_3',
 '_4',
 '_5',
 '_6',
 '_7',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i2',
 '_i3',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_i8',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'cols',
 'exit',
 'get_ipython',
 'quit']

### 모듈의 이름을 관리하는 속성

In [98]:
__name__

'__main__'

### 다른 모듈을 가져온 후에 모듈의 이름을 확인한다.

In [99]:
import collections
if __name__ =="__main__" :
    print(" 모듈이 실행될 때 메인으로 처리할 로직이 들어감 ")
    print(f"임포트한 모듈 이름은 {collections.__name__}")

 모듈이 실행될 때 메인으로 처리할 로직이 들어감 
임포트한 모듈 이름은 collections


## 유니코드 문자열과 바이트 문자열 구분하기

- 텍스트는 인간이 인식하는 문자열이므로 여러 바이트로 된 문자열을 사용 : 유니코드
- 컴퓨터는 기본 한 바이트 문자열을 사용 : ascii
- 문자열으 변경 불가한 자료형이다.

In [100]:
s = "강아지"

In [15]:
len(s)

3

In [16]:
s.encode()

b'\xea\xb0\x95\xec\x95\x84\xec\xa7\x80'

In [17]:
len(s.encode())

9

In [18]:
b"\xea\xb0\x95".decode()

'강'

### 바이트 문자열

- bytes 클래스나 b"" 리터럴 표기법으로 생성
- 유니코드 문자열을 암호화해서 생성 가능 

In [19]:
bt = bytes("ABC".encode())

In [20]:
bt

b'ABC'

In [21]:
isinstance(b"abc", bytes)

True

### 변경가능한 바이트 문자열 처리
- 하나의 배열로 처리
- 값을 변경할 때는 숫자로 넣어서 처리

In [22]:
ba = bytearray(b"abce")

In [23]:
ba

bytearray(b'abce')

In [24]:
ord('d')

100

In [25]:
ba[3] = 100

In [26]:
ba

bytearray(b'abcd')

In [27]:
chr(ba[0])

'a'

## repr 함수 이해하기

- 즉시 실행이 가능한 표현으로 처리
- 보통 출력문은 str로 처리한 문자열
- repr로 처리하면 인터프리터 실행화면에 보여주는 결과를 보여준다
   ==> 문자열로 전달할 경우 실행창에 문자열로 추가 표시

In [28]:
a = repr("a = 100")

In [29]:
a

"'a = 100'"

In [30]:
eval(a)

'a = 100'

In [31]:
b = repr(100)

In [32]:
b

'100'

In [33]:
eval(b)

100

In [34]:
str(a)

"'a = 100'"

In [35]:
str(b)

'100'

## 리스트, 튜플 리터럴 표기법

- 리스트와 튜플은 원소들이 동일한 자료형은 뭘까? ==> object

In [36]:
[1,2,3]

[1, 2, 3]

In [37]:
(1,2,3)

(1, 2, 3)

In [38]:
type([1,2,3]), type((1,2,3))

(list, tuple)

### 문자열 생성자 표기법 

In [39]:
str("문자열")

'문자열'

### 문자열은 바이트 문자열로 변환

In [40]:
try :
    bytes('abc')
except Exception as e :
    print(e)

string argument without an encoding


In [41]:
bytes('abc'.encode())

b'abc'

In [42]:
bytes(b'abc')

b'abc'

### 리스트 생성자 표기법 : 숫자

In [43]:
list([1,2,3])

[1, 2, 3]

### 리스트 생성자 표기법 : 문자열과 바이트 문자열

In [44]:
list('abc')

['a', 'b', 'c']

In [45]:
list(b'abc')

[97, 98, 99]

### 튜플 생성자 표기법

In [46]:
tuple('abc')

('a', 'b', 'c')

In [47]:
tuple(b'abc')

(97, 98, 99)

## 연산자 사용하기

- 문자열이나 리스트 등에서 일부 연산자를 사용해서 처리가능
- + , *  연산자 가능

### 두 개의 시퀀스를 결합

In [48]:
"hell" +"o"

'hello'

In [49]:
[1,2,3] + [4]

[1, 2, 3, 4]

In [50]:
### 원소의 개수를 확대

In [51]:
"_" * 30

'______________________________'

In [52]:
[13] * 10

[13, 13, 13, 13, 13, 13, 13, 13, 13, 13]

## 시퀀스 원소 조회하기

- 대괄호 연산 내에 인덱스를 넣어 조회
- 특정 범위도 조회가 가능

### 하나의 정수값으로 조회하기

In [53]:
st = "시퀀스문장열조회하기"

In [54]:
len(st)

10

In [55]:
st[0]

'시'

In [56]:
st[len(st) -1]

'기'

### 음수로 조회하기

- 반대 방향으로 원소 조회

In [57]:
st[-1]

'기'

In [58]:
st[-1 * len(st)]

'시'

### 여러 원소 조회하기

- 슬라이스라고 부른다. 

In [59]:
sl = slice(2,5)

In [60]:
st[sl]

'스문장'

In [61]:
st[ : ]

'시퀀스문장열조회하기'

In [62]:
st[ : 100]

'시퀀스문장열조회하기'

### 간격을 주고 조회하기 

In [63]:
st[: :2]

'시스장조하'

## 객체 주소 및 원소 비교하기

In [101]:
numbers1= [1, 2, 3]; numbers2 = [1, 2, 3]

In [102]:
numbers1 is numbers2

False

In [103]:
id(numbers1), id(numbers2)

(140326717138896, 140326716679504)

In [104]:
numbers1 == numbers2

True

In [105]:
class Some:
    def __eq__(self, other):
        #print(other) # self, other관계를 증명하면 됩니다.
        return True

In [106]:
o1 = Some(); o2 = Some()

In [107]:
o1 is o2

False

In [108]:
print(o1 == 'string')
print(o1 == 123)

True
True


## 복사 알아보기

- 복사는 기본 객체를 전부 다른 객체로 반드는 것이다.
- 변수를 다른 변수에 할당하는 것은 복사가 아니라 별칭을 하나 더 만드는 것이다.

- 깊은 복사 : 리스트 내부에 리스트가 있을 경우에도 전부 새로운 객체로 복사
- 얇은 복사 : 리스트 내부에 리스트가 있는 경우에 기존 값으로 복사

### 별칭 만들기
- 동일한 객체의 주소를 가진 변수가 하나 더 만들어진다.

In [64]:
ll = [[1],[2]]

In [65]:
ll_a = ll

In [66]:
id(ll_a); id(ll)

140326716974096

In [67]:
id(ll_a) == id(ll)

True

### 리스트에 리스트가 원소로 포함된 경우 

- 복사하면 내부 리스트가 새로운 객체로 만들어지지 않아서 값을 변경하면 원본도 변경

In [68]:
ll_cp = ll.copy()

In [69]:
ll[0][0] = 100

In [70]:
ll

[[100], [2]]

In [71]:
ll_cp

[[100], [2]]

### 깊은 복사는 별도의 모듈로 제공

- deepcopy 함수로 리스트 내의 리스트도 전부 복사해서 새로운 객체를 만들어야 준다

In [72]:
import copy

In [73]:
ll_cp_ = copy.deepcopy(ll)

In [74]:
ll_cp_

[[100], [2]]

In [75]:
ll_cp_[0][0] = 999

In [76]:
ll_cp_

[[999], [2]]

In [77]:
ll

[[100], [2]]

## 빈문자열과 빈리스트 처리

- 조건식을 처리할 때 빈 문자열 등은 거짓으로 판단한다.
- 숫자일 경우 0은 거짓으로 판단한다.

In [78]:
bbs = ""; bbl =[]

In [79]:
print(type(bbs)); print(type(bbl))

<class 'str'>
<class 'list'>


In [80]:
if bbs :
    print(" True ")
else :
    print(" False ")

 False 


In [81]:
bool(bbl)

False

In [82]:
bool(0)

False

# 2. MAP, Set 자료형 

- 키 즉 유일한 값을 가지고 값과 매핑된 자료구조  : map 클래스
- 유일한 값만 가지는 자료구존 : set 클래스

### 리터럴표기법 : 딕셔너리

In [15]:
type({})

dict

### 리터럴표기법 :  빈 집합

In [14]:
type(set()), type(frozenset())

(set, frozenset)

### 리터럴표기법

In [83]:
{'a':1,'b':2}

{'a': 1, 'b': 2}

In [84]:
{1,2,3,4}

{1, 2, 3, 4}

### 생성자 표기법 
- 딕셔너리는 키와 값을 쌍으로 가진 튜플을 원소로 하는 리스트를 넣고 생성한다


In [85]:
dict([('a',1),('b',2)])

{'a': 1, 'b': 2}

In [86]:
set((1,2,3))

{1, 2, 3}

In [11]:
frozenset([1,2,3])

frozenset({1, 2, 3})

## 연산자 사용하기

- 집합일 경우 집합 연산자로 인식


In [87]:
s = {1,2,3,}; b = {1}

In [88]:
s-b

{2, 3}

### 집합은 별도의 연산자 처리 없음

In [89]:
m = { 1:1,2:2}; m1 = {3:3}

In [90]:
try :
    m + m1
except Exception as e :
    print(e)

unsupported operand type(s) for +: 'dict' and 'dict'


## 빈 딕셔너리와 집합 알아보기

In [91]:
ddd = {}

In [92]:
sss = set()

In [93]:
print(type(ddd)); print(type(sss))

<class 'dict'>
<class 'set'>


In [94]:
bool(ddd)

False

In [95]:
bool(sss)

False