<a href='https://github.com/SeWonKwon' ><div> <img src ='https://slid-capture.s3.ap-northeast-2.amazonaws.com/public/image_upload/6556674324ed41a289a354258718280d/964e5a8b-75ad-41fc-ae75-0ca66d06fbc7.png' align='left' /> </div></a>


###### Ch 02 내장 시퀀스 타입

**시퀀스**<sub>sequence</sub> 데이터 타입

* **멤버쉽**membership 연산 : `in` 키워드 사용
* **크기**size 함수 : `len(seq)`
* **슬라이싱**slicing 속성 : `seq[:-1]`
* **반복성**iterability : 반복문에 있는 데이터를 순회할 수 있음

내장 시퀀스 타입 : **문자열, 튜플, 리스트, 바이트 배열, 바이트**

|유형|자료형|설명|선언|
|:----:|:------|:----|:----|
|문자형|문자열(string type)|값이 문자로 출력되는 자료형|s = "Codechef"|
|시퀀스형|리스트(list type)|여러 요소를 묶어 하나의 변수로 사용|l = [1, 2, 3]|
|시퀀스형|튜플(tuple type)|리스트와 유사하지만 생성, 삭제, 수정 불가|t = (1, 2, 3)|
|시퀀스형|범위(range type)|숫자의 불변한 시퀀스 형태|range(10)|
|집합형|집합(set type)|중복과 순서가 없는 집합을 위한 자료형|s = {1, 2, 3}|
|집합형|불변 집합(fronzenset type)|불변한 집합을 위한 자료형|fs = frozenset{1, 2, 3}|
|매핑형|딕셔너리(dictionary type)|키(key)와 값(value)이 쌍(pair)으로 들어간 자료형|d = {1: 'One', 2:'Two'}|
|바이트 시퀀스형|바이트(byte type)|바이트 값을 가지는 자료형|byte = b'hello'|
|바이트 시퀀스형|bytearray type|바이트의 시퀀스 형태로 수정 가능한 자료형|ba = bytearray(b'hello')|
|바이트 시퀀스형|memoryview type|바이트의 메모리 값으로 표현한 자료형|mv = memoryview(b'hello')|




# 2.1 깊은 복사와 슬라이싱 연산

## 2.1.1 가변성

ch 01에서 숫자는 불변<sub>immutable</sub> 타입이었지만, **가변**<sub>mutable</sub> 타입에 대해서 살펴보자.  

* 불변 : 튜플, 문자열, 바이트
* 가변 : 리스트, 바이트

In [1]:
myList = [1, 2, 3, 4]
newList = myList[:]
newList2 = list(myList)

셋(set)의 깊은 복사 예제.

In [3]:
people = {'버피', '에인절', '자일스'}
slayers = people.copy()
slayers.discard('자일스')
slayers.remove('에인절')

slayers

{'버피'}

In [4]:
people

{'버피', '에인절', '자일스'}

딕셔너리(dict)의 깊은 복사 예제

In [5]:
myDict = {'안녕': '세상'}
newDict = myDict.copy()

copy 모듈을 사용한 예제

In [6]:
import copy

myObj = '어떤 다른 객체'
newObj1 = copy.copy(myObj) # 얕은 복사(shalow copy)
newObj2 = copy.deepcopy(myObj) # 깊은 복사

## 2.1.2 슬라이싱 연산자

```{python}
seq[시작]
seq[시작:끝]
seq[시작:끝:스텝]
```

In [7]:
s = '슬라이싱'

In [8]:
s[1]

'라'

In [9]:
s[1:]

'라이싱'

In [11]:
s[1:3]

'라이'

In [12]:
s[::-1]

'싱이라슬'

# 2.2 문자열

파이썬은 불변의 str 타입을 사용하여 **문자열**string을 표현한다.  
문자열이란 곧 일련의 문자<sub>sequence of characters</sub>이다.

파이썬의 모든 객체에는 두가지 출력 형식이 있다. 

문자열stirng 형식은 사람을 위해서 설계되었고, <br>
표현representational형식은 파이썬 인터프리터에서 사용하는 문자열로 보통 디버깅에 사용된다.   

파이썬 클래스를 작성할 때에는 문자열 표현을 정의하는 것이 중요하다. 

참조1 : https://stackoverflow.com/questions/38418070   
참조2 : https://docs.python.org/3/reference/datamodel.html#object.__repr__

## 2.2.1 유니코드 문자열

**유니코드**Unicode는 전 세계 언어의 문자를 정의하기 위한 국제 표준 코드다.  
유니코드는 공백, 특수문자, 수학 및 기타 분야의 기호들도 포함하고 있다.   

In [13]:
u'안녕\u0020파이썬 !'

'안녕 파이썬 !'

위에서 이스케이프 시퀀스<sub>escape sequence</sub> 는 서수 값이 0x0020인 유니코드 문자를 나타낸다.  

아스키 코드<sub>ASCII code</sub> 의 표현은 7비트(아스키 코드를 확장한 ANSI 코드는 8비트), 유니코드 표현에는 16비트가 필요하다. 

## 2.2.2 문자열 메서드

* `A.join(B)` : 리스트 B에 있는 모든 문자열을 하나의 단일 문자열 A로 결합

In [2]:
slayer = ['버피', '앤', '아스틴']
"<__>".join(slayer)

'버피<__>앤<__>아스틴'

In [3]:
"".join(reversed(slayer))

'아스틴앤버피'

* `ljust(), rjust()` : (width, fillchar)



In [4]:
name = '스칼렛'

name.ljust(50, '-')

'스칼렛-----------------------------------------------'

In [5]:
name.rjust(50, '-')

'-----------------------------------------------스칼렛'

* format()

In [6]:
'1{},2{}'.format('first','second')

'1first,2second'

* **문자열 언패킹**

문자열 매핑 언패킹(mapping unpacking) 연산자는 `**`이며, `locals()`메서드는 현재 스코프scope에 있는 지역 변수<sub>local variable</sbu>를 딕셔너리로 반환한다.

In [8]:
hero = '버피'
number = 1234

'{number} : {hero}'.format(**locals())

'1234 : 버피'

* `splitlines()`

In [9]:
slayers = '로미오\n줄리엣'
slayers.splitlines()

['로미오', '줄리엣']

* `split()` 

* `strip()`

In [17]:
%%writefile 1_count_unique_words.py
import string
import sys


def count_unique_word():
    words = {}
    strip = string.whitespace + string.punctuation + string.digits + "\"'"
    for filename in sys.argv[1:]:
        with open(filename) as file:
            for line in file:
                for word in line.lower().split():
                    word = word.strip(strip)
                    if len(word) > 2:
                        words[word] = words.get(word, 0) + 1

    for word in sorted(words):
        print("'{0}': {1}".format(word, words[word]))


if __name__ == "__main__":
    count_unique_word()

Overwriting 1_count_unique_words.py


In [20]:
# !type 1_count_unique_words.py

In [19]:
!python 1_count_unique_words.py 1_count_unique_words.py

'count_unique_word': 2
'def': 1
'file': 2
'filename': 1
'for': 4
'format(word': 1
'import': 2
'len(word': 1
'line': 1
'line.lower().split': 1
'main': 1
'name': 1
'open(filename': 1
'print': 1
'sorted(words': 1
'string': 1
'string.digits': 1
'string.punctuation': 1
'string.whitespace': 1
'strip': 1
'sys': 1
'sys.argv': 1
'with': 1
'word': 3
'word.strip(strip': 1
'words': 1
'words.get(word': 1
'words[word': 2


* `swapcase()`

In [21]:
slayer = 'Abcd Efg'
slayer.swapcase()

'aBCD eFG'

* `index(), find()` 

In [32]:
slayers = 'Buffy and Faithy'
slayers.find('y')

4

In [33]:
slayers.find('k')

-1

In [34]:
slayers.index('y')

4

In [36]:
# rfind()
slayers.rfind('y')

15

* `count()`

In [37]:
slayer = 'Buffy is Buffy is Buffy'
slayer.count('Buffy', 0, -1)

2

In [38]:
slayer.count('Buffy')

3

* `replace()`

In [39]:
slayer = 'Buffy is Buffy is Buffy'
slayer.replace('Buffy', 'who', 2)

'who is who is Buffy'

* **f스트링**(formatted string literal)

In [40]:
name='codeChef'

f'내 이름은 {name}입니다.'

'내 이름은 codeChef입니다.'

참조 : https://www.python.org/dev/peps/pep-0498/


# 2.3 튜플

* 리스트와 유사하지만 변경 불가능한 시퀀스 자료형
* 하나의 변수에 여러 값 할당 가능
* ‘(‘와 ‘)’를 사용하여 표현
*  괄호를 쓰지 않으면 튜플이다.


In [2]:
t1 = 1234, '안녕!'
type(t1)

tuple

In [3]:
t1

(1234, '안녕!')

In [4]:
t1[1]

'안녕!'

In [6]:
t2 = t1, (1, 2, 3, 4, 5) # nested
t2

((1234, '안녕!'), (1, 2, 3, 4, 5))

## 2.3.1 튜플 메서드

`A.count(x)`

In [8]:
t = 1, 5, 7, 8, 9, 4, 1, 4

t.count(4)

2

`A.index(x)`

In [9]:
t.index(4)

5

In [11]:
# t.rindex(4)

## 2.3.2 튜플 언패킹

**시퀀스 언패킹 연산자**<sub>sequence unpacking operator</sub>

모든 반복 가능한<sub>iterable</sub> 객체는 `*`를 사용하여 언패킹 할수 있다. 

In [12]:
x, *y = 1, 2, 3, 4

In [14]:
y

[2, 3, 4]

In [15]:
x, *y, z = 1, 2, 3, 4, 5, 6

In [17]:
y

[2, 3, 4, 5]

## 2.3.3 네임드 튜플 

`collections` 모듈의 **네임드 튜플**<sub>named tuple</sub>

In [18]:
import collections

Person = collections.namedtuple('Person', 'name age gender')

In [19]:
p = Person('아스티', 30, '남자')

In [21]:
p.name

'아스티'

In [22]:
try:
    p.age = 20
except AttributeError as e:
    print(e)

can't set attribute


# 2.4 리스트

**배열**<sub>array</sub> 은 여러 원소(elements)들이 연속된 메모리에 순차적으로 저장되는 매우 간단한 구조다. **연결 리스트**<sub>linked list</sub>는 여러 분리된 노드node가 서로 연결되어 있는 구조다. 

자료구조의 내용을 순회<sub>iterating</sub>하는 데에는 둘 모두 똑같이 효율적이지만, 어떤 요소(또는 노드)에 **직접 접근**할 때 배열의 시간복잡도<sub>time complexity</sub>는 $O(1)$이고, 연결 리스트는 $O(n)$이다.

또한 연결 리스트에서 어떤 노드를 삽입할 때, 그 위치를 안다면 연결 리스트 노드 수에 상관없이 시간복잡도는 $O(1)$이다. 배열에서 어떤 위치에 항목을 **삽입**하려면, 그 위치에서부터 모든 항목을 오른쪽으로 옮겨야 하므로 시간복잡도는 $O(n)$이다. 

파이썬에서 배열과 유사한 객체는 **리스트**list이다.   

리스트는 크기를 동적으로 조정할 수 있는 배열이다. 연결 리스트와는 아무런 관련도 없다. 

연결 리스트는 매우 중요한 **추상 데이터 타입**(ADT)이다.

배열(또는 파이썬 리스트)과 연결 리스트의 차이점을 아는 것은 매우 중요하다. 



리스트는 가변 타입이다. 

In [24]:
q = [2, 3]
p = [1, q, 4]

p[1].append('매롱')

q

[2, 3, '매롱']

`append()`와`pop()` 메서드를 사용하며, 시간복잡도는 $O(1)$이다. 

`remove()`,`index()`, 멤버십 테스트 `in` 등의 시간복잡도는 $O(n)$이다.

`insert()`메서드 $O(n)$이다.

검색이나 멤버십 테스트 시 빠른 속도가 필요하다면 **셋**set이다 **딕셔너리**dictionary 같은 컬렉션 타입을 선택하는 것이 더 적합할 수 있다. 

또는 리스트에 항목을 순서대로 정렬하여 보관하면, 빠른 검색을 제공할 수 있다.(10장에서 시간복잡도가 $O(\log{n})$ 인 검색 알고리즘에 대해서 살펴본다. 

## 2.4.1 리스트 메서드

`append()`

`extend()`

`insert()`

`remove()`

`pop()`

`del a[]`

`index()`

`count()`

`sort()`

`reverse()`

## 2.4.2 리스트 언패킹

**시퀀스 언패킹 연산자**<sub>sequence unpacking operator</sub>

모든 반복 가능한<sub>iterable</sub> 객체는 `*`를 사용하여 언패킹 할수 있다. 

In [25]:
def example_args(a, b, c):
    return a * b * c

In [26]:
L = [2, 3, 4]

example_args(*L)

24

In [27]:
example_args(5, *L[1:])

60

## 2.4.3 리스트 컴프리헨션

In [28]:
p63

NameError: name 'p63' is not defined

## 2.4.4 리스트 메서드

# 2.5 바이트와 바이트 배열

## 2.5.1 비트와 비트 연산자

# 2.6 연습문제

## 2.6.1 문자열 전체 반전하기

## 2.6.2 문자열 단어

## 2.6.3 단순 문자열 압축

## 2.6.4 문자열 순열

## 2.6.5 회문

**Reference**

* <a href='https://github.com/SeWonKwon' ><div> <img src ='https://slid-capture.s3.ap-northeast-2.amazonaws.com/public/image_upload/6556674324ed41a289a354258718280d/964e5a8b-75ad-41fc-ae75-0ca66d06fbc7.png' align='left' /> </div></a>

<br>

* [파이썬 자료구조와 알고리즘, 미아 스타인](https://github.com/AstinCHOI/Python-and-Algorithms-and-Data-Structures)