## Chapter 02 내장 시퀀스 타입

### 파이썬 내장 시퀀스 데이터 타입은 다음과 같은 속성을 가짐
* 멤버십(membership) 연산: in 키워드 사용
* 크기(size) 함수: len(seq)
* 슬라이싱(slicing) 속성: seq[:-1]
* 반복성(iterability): 반복문에 있는 데이터를 순회할 수 있음

In [1]:
## 파이썬에는 문자열, 튜플, 리스트, 바이트 배열, 바이트 등 총 5개의 내장 시퀀스 타입 존재
l = []
type(l)

list

In [2]:
s = ""
type(s)

str

In [3]:
t = ()
type(t)

tuple

In [4]:
ba = bytearray(b"")
type(ba)

bytearray

In [5]:
b = bytes([])
type(b)

bytes

## 2.1 깊은 복사와 슬라이싱 연산

### 2.1.1 가변성
* 튜플, 문자열, 바이트는 불변(immutable) 객체 타입
* 반면 리스트, 셋, 딕셔너리는 가변(mutable) 객체 타입
* 일반적으로 불변 객체 타입은 가변 객체 타입보다 효율적

In [1]:
# 깊은 복사(deep copy)의 개념: 요소는 같으나 주소값(id)이 달라 아예 다른 객체가 됨
myList = [1, 2, 3, 4]
newList = myList[:]
newList2 = list(myList)

In [2]:
id(newList) == id(myList)

False

In [3]:
id(newList2) == id(myList)

False

In [4]:
# set의 깊은 복사: 주소값이 다름
people = {"버피", "에인절", "자일스"}
slayers = people.copy()
slayers.discard("자일스")
slayers.remove("에인절")
slayers

{'버피'}

In [5]:
people

{'버피', '에인절', '자일스'}

In [6]:
id(people) == id(slayers)

False

In [7]:
# dict의 깊은 복사: 주소값이 다름
myDict = {"안녕": "세상"}
newDict = myDict.copy()

In [8]:
id(myDict) == id(newDict)

False

### 1. 단순 객체 복제

In [9]:
a = [1, 2, 3, 4]
b = a     # copy가 아닌 a를 참조하는 b 변수를 만든 것

In [10]:
id(a) == id(b)  # 단순 참조이기 때문에 주소값 동일

True

In [11]:
b[2] = 100   # b의 item 변경
print(b)    # [1, 2, 100, 4]
print(a)    # [1, 2, 100, 4], a의 item도 수정됨!!

[1, 2, 100, 4]
[1, 2, 100, 4]


In [12]:
id(a) == id(b)

True

### 복사된 참조 변수를 수정했을때, 처음에 할당한 참조 변수의 값 역시 똑같이 수정되는 것은 리스트와 같은 변경가능(mutable) 객체일 때만 해당한다는 것입니다. 숫자나 문자열과 같은 불변의(immutable) 객체일때는 위의 경우가 해당되지 않습니다.

In [13]:
a = 10
b = a    # immutable 객체를 참조

In [14]:
id(a) == id(b)    # 주소값은 같으나...

True

In [15]:
b = "abc"   # b는 a로부터의 할당을 끊고 새로운 객체를 할당 받음
print(b)
print(a)

abc
10


In [16]:
id(a) == id(b)

False

### 2. 얕은 복사(shallow copy)

In [17]:
import copy

a = [1, [1, 2, 3]]
b = copy.copy(a)    # shallow copy

In [18]:
id(a) == id(b)   # shallow copy는 주소값이 처음부터 다름

False

In [23]:
id(a[1]) == id(b[1])    # 내부 요소 중 mutable 요소(list, set, dict)는 특이하게 주소가 같음

True

In [24]:
b[0] = 100
print(a)
print(b)
# immutable 요소가 바뀌어도 원래 변수의 요소는 바뀌지 않음

[1, [1, 2, 3, 4]]
[100, [1, 2, 3, 4]]


In [25]:
c = copy.copy(a)
c[1].append(4)
print(a)
print(c)
# 반면 mutable 요소가 바뀌면 원래 변수도 따라 바뀜(주소값이 같으므로)

[1, [1, 2, 3, 4, 4]]
[1, [1, 2, 3, 4, 4]]


In [26]:
id(a) == id(c)

False

In [27]:
id(a[1]) == id(c[1])

True

### 3. 깊은 복사
* mutable한 내부객체(내부리스트)의 문제를 해결하기 위해 사용
* 얕은 복사는 복합객체(리스트)만 복사되고 그 안의 내용은 동일한 객체 참조
* 깊은 복사는 복합객체를 새롭게 생성하고 그 안의 내용까지 새롭게 생성

In [28]:
import copy

a = [1, [1, 2, 3]]
b = copy.deepcopy(a)    # deep copy

In [29]:
id(a) == id(b)

False

In [30]:
id(a[1]) == id(b[1])    # 내부리스트도 새롭게 생성된 것 확인

False

In [31]:
b[0] = 100
b[1].append(4)
print(a)
print(b)

[1, [1, 2, 3]]
[100, [1, 2, 3, 4]]


## 2.1.2 슬라이싱 연산자
* seq[시작]
* seq[시작:끝]
* seq[시작:끝:스텝]

In [32]:
word = "뱀파이어를 조심해!"
word[-1]

'!'

In [33]:
word[-2]

'해'

In [34]:
word[-2:]

'해!'

In [35]:
word[:-2]

'뱀파이어를 조심'

In [36]:
word[-0]

'뱀'

## 2.2 문자열

### 2.2.1 유니코드 문자열

In [37]:
u'잘가\u0020세상!'
# escape sequence는 서수 값이 0x0020인 유니코드 문자를 나타냄
# 일반적인 ASCII code의 표현은 7비트(아스키 코드를 확장한 ANSI 코드는 8비트)

'잘가 세상!'

### 2.2.2 문자열 메서드

In [38]:
# A.join(B)
slayer = ['버피', '앤', '아스틴']
" ".join(slayer)

'버피 앤 아스틴'

In [39]:
"-<>-".join(slayer)

'버피-<>-앤-<>-아스틴'

In [40]:
"".join(slayer)

'버피앤아스틴'

In [41]:
"".join(reversed(slayer))

'아스틴앤버피'

In [42]:
# ljust(), rjust()
# A.ljust(width, fillchar)는 문자열 A "맨 처음"부터 문자열을 포함한 길이 width만큼 문자 fillchar를 채움
name = "스칼렛"
name.ljust(50, '-')

'스칼렛-----------------------------------------------'

In [43]:
name.rjust(50, '-')

'-----------------------------------------------스칼렛'

In [44]:
# A.format(): 문자열 A에 변수를 추가하거나 형식화하는 데 사용
"{0} {1}".format("안녕,", "파이썬!")

'안녕, 파이썬!'

In [45]:
"이름: {who}, 나이: {age}".format(who="제임스", age=17)

'이름: 제임스, 나이: 17'

In [46]:
"이름: {who}, 나이: {0}".format(12, who="에이미")

'이름: 에이미, 나이: 12'

In [47]:
"{} {} {}".format("파이썬", "자료구조", "알고리즘")

'파이썬 자료구조 알고리즘'

In [48]:
# s는 str, r은 repr, a는 ASCII
import decimal

"{0} {0!s} {0!r} {0!a}".format(decimal.Decimal("99.9"))

"99.9 99.9 Decimal('99.9') Decimal('99.9')"

In [51]:
# 문자열 언패킹
# 문자열 매핑 언패킹(mapping unpacking) 연산자는 **
# 함수로 전달하기에 적합한 키=값 딕셔너리가 생성
# locals() 메서드는 현재 스코프에 있는 지역변수를 딕셔너리로 반환
hero = "버피"
number = 999
"{number}: {hero}".format(**locals())

'999: 버피'

In [52]:
# A.splitlines(): 문자열 A에 대해 줄바꿈 문자를 기준으로 분리한 결과를 문자열 리스트로 반환
slayers = "로미오\n줄리엣"
slayers.splitlines()

['로미오', '줄리엣']

In [54]:
# A.split(t, n): 문자열 A에서 문자열 t를 기준으로 정수 n번만큼 분리한 문자열 리스트를 반환
slayers = "버피*크리스-메리*16"
fields = slayers.split("*")
fields

['버피', '크리스-메리', '16']

In [56]:
job = fields[1].split("-")
job

['크리스', '메리']

In [57]:
# split() 활용
def erase_space_from_string(string):
    s1 = string.split(" ")
    s2 = "".join(s1)
    return s2

str1 = "띄 어 쓰기"
erase_space_from_string(str1)

'띄어쓰기'

In [58]:
start = "안녕*세상*!"
start.split("*", 1)

['안녕', '세상*!']

In [59]:
start.rsplit("*", 1)

['안녕*세상', '!']

In [60]:
# strip()
# A.strip(B): 문자열 A 앞뒤의 문자열 B를 제거
# 인수 B가 없으면 공백 문자를 제거
slayers = "로미오 & 줄리엣999"
slayers.strip("999")

'로미오 & 줄리엣'

In [64]:
# strip() 메서드로 한 파일에서 사용된 모든 단어를 알파벳순으로 출력
# 각 단어가 등장한 횟수도 함께 출력
import string
import sys

def count_unique_word():
    words = {}
    strip = string.whitespace + string.punctuation + string.digits
    for filename in sys.argv[1:]:
        with open(filename) as file:
            for line in file:
                for word in line.lower().split():
                    word = word.strip(strip)
                    if len(word) > 2:
                        words[word] = words.get(word, 0) + 1
                        
    for word in sorted(words):
        print("{0}: {1}번".format(word, words[word]))
        
if __name__ == "__main__":
    count_unique_word()

FileNotFoundError: [Errno 2] No such file or directory: '-f'

In [65]:
# swapcase() 메서드
# A.swapcase()는 대소문자 반전
slayers = "Buffy and Faith"
slayers.swapcase()

'bUFFY AND fAITH'

In [66]:
# caplitalize()는 문자열 첫글자를 대문자
# lower(), upper()
slayers.capitalize()

'Buffy and faith'

In [67]:
slayers.lower()

'buffy and faith'

In [68]:
# A.index(sub, start, end): 문자열 A에서 부분 문자열 sub의 인덱스 위치 반환, 실패시 ValueError 발생
# A.find(sub, start, end): 문자열 A에서 부분 문자열 인덱스 위치 반환, 실패하면 -1 반환
slayers = "Buffy and Faith"
slayers.find("y")

4

In [69]:
slayers.find("k")

-1

In [70]:
slayers.index("k")

ValueError: substring not found

In [71]:
# A.count(sub, start, end): 문자열 A에서 인덱스 start, end 범위 내의 부분 문자열 sub가 나온 횟수 반환
slayer = "Buffy is Buffy is Buffy"
slayer.count("Buffy", 0, -1)

2

In [72]:
slayer.count("Buffy")

3

In [73]:
# A.replace(old, new, maxreplace): 문자열 A에서 문자열 old를 new로 maxreplace만큼 변경한 문자열의 복사본을 반환
slayer = "Buffy is Buffy is Buffy"
slayer.replace("Buffy", "who", 2)

'who is who is Buffy'

In [74]:
# f-strings
name = "프레드"
f"그의 이름은 {name!r}입니다."

"그의 이름은 '프레드'입니다."

In [75]:
f"그의 이름은 {repr(name)}입니다."    # repr()은 !r과 같다.

"그의 이름은 '프레드'입니다."

In [76]:
import decimal
width = 10
precision = 4
value = decimal.Decimal("12.34567")
f"결과: {value:{width}.{precision}}"  # 중첩필드 사용

'결과:      12.35'

In [77]:
from datetime import datetime
today = datetime(year=2020, month=4, day=25)
f"{today:%B %d, %Y}"   # 날짜 포멧 지정 지정자(specifier) 사용

'April 25, 2020'

In [78]:
number = 1024
f"{number:#0x}"   # 16진수 표현

'0x400'

## 2.3 튜플

In [1]:
t1 = 1234, '안녕!'
t1[0]

1234

In [3]:
t1

(1234, '안녕!')

In [5]:
t2 = t1, (1,2,3,4,5)  # 중첩됨(nested)
t2

((1234, '안녕!'), (1, 2, 3, 4, 5))

In [6]:
empty = ()
t1 = '안녕',  # 또는 ('안녕',)
len(empty)

0

In [7]:
t1

('안녕',)

In [8]:
t2 = ('안녕')
type(t2)

str

### 2.3.1 튜플 메서드

In [9]:
# A.count(x): 요소 x의 개수 세기
t = 1, 5, 7, 8, 9, 4, 1, 4
t.count(4)

2

In [10]:
# A.index(x): 요소 x의 위치 반환
t = 1, 5, 7
t.index(5)

1

In [11]:
t.index(8)

ValueError: tuple.index(x): x not in tuple

### 2.3.2 튜플 언패킹
* iterable 객체는 sequence unpacking operator인 *를 사용하여 언패킹 가능

In [12]:
x, *y = (1, 2, 3, 4)
x

1

In [13]:
y

[2, 3, 4]

In [14]:
*x, y = (1, 2, 3, 4)
x

[1, 2, 3]

In [15]:
y

4

### 2.3.3 네임드 튜플
 * collections에는 named tuple이라는 시퀀스 데이터 타입 존재
 * named tuple은 튜플 항목을 인덱스 위치뿐만 아니라 이름으로도 참조 가능

In [30]:
import collections

Person = collections.namedtuple('Person', 'name age gender')
# Person = collections.namedtuple('Person', ['name', 'age', 'gender'])
# Person = collections.namedtuple('Person', ('name', 'age', 'gender'))
p = Person('아스틴', 30, '남자')
p

Person(name='아스틴', age=30, gender='남자')

In [31]:
p[0]

'아스틴'

In [32]:
p.name

'아스틴'

In [33]:
p.age = 20 # 에러: 일반 튜플과 마찬가지로 불변형이다

AttributeError: can't set attribute

## 2.4 리스트

In [34]:
q = [2, 3]
p = [1, q, 4]
p[1].append("버피")
p

[1, [2, 3, '버피'], 4]

In [35]:
q

[2, 3, '버피']

* append(), pop(): 리스트 끝에서 항목을 추가하거나 제거(O(1))
* remove(), index(), in: 리스트 항목 검색 필요(O(n))
* insert(): 지정한 인덱스에 항목 삽입 후, 그 이후의 인덱스 항목들을 한 칸씩 뒤로 밈(O(n))
* 빠른 속도가 요구된다면 set, dict 같은 컬렉션 타입이 더 적합

### 2.4.1 리스트 메서드

In [37]:
# A.append(x): 리스트 A 끝에 항목 x를 추가
# A[len(A):] = [x] 와 동일

people = ['버피', '페이스']
people.append("자일스")
people

['버피', '페이스', '자일스']

In [38]:
people[len(people):] = "젠더"
people

['버피', '페이스', '자일스', '젠', '더']

In [39]:
people[len(people):] = ["젠더"]
people

['버피', '페이스', '자일스', '젠', '더', '젠더']

In [40]:
# A.extend(c): 반복 가능한 모든 항목 c를 리스트 A에 추가
# A[len(A):] = c 혹은 A += c와 동일

people = ['버피', '페이스']
people.extend("자일스")
people

['버피', '페이스', '자', '일', '스']

In [41]:
people += "윌로"
people

['버피', '페이스', '자', '일', '스', '윌', '로']

In [42]:
people += ["잰더"]
people

['버피', '페이스', '자', '일', '스', '윌', '로', '잰더']

In [43]:
people[len(people):] = "아스틴"
people

['버피', '페이스', '자', '일', '스', '윌', '로', '잰더', '아', '스', '틴']

In [44]:
# A.insert(i, x)는 리스트 A의 인덱스 위치 i에 항목 x를 삽입
people = ['버피', '페이스']
people.insert(1, '젠더')
people

['버피', '젠더', '페이스']

In [45]:
# A.remove(x)는 리스트 A의 항목 x를 제거, x가 없으면 ValueError 예외 발생
people = ['버피', '페이스']
people.remove("버피")
people

['페이스']

In [46]:
people.remove("버피")

ValueError: list.remove(x): x not in list

In [47]:
# A.pop(x)는 리스트 A에서 인덱스 x에 있는 항목을 제거하고 그 항목을 반환
# x 미지정 시 리스트 맨 끝 항목을 제거하고 그 항목을 반환
people = ['버피', '페이스', '아스틴']
people.pop(1)

'페이스'

In [48]:
people

['버피', '아스틴']

In [49]:
people.pop()

'아스틴'

In [50]:
people

['버피']

In [53]:
# del a[x] : 리스트 인덱스를 지정하여 특정 항목 삭제

a = [-1, 4, 5, 7, 10]
del a[0]
a

[4, 5, 7, 10]

In [54]:
del a[2:3]
a

[4, 5, 10]

In [55]:
del a  # 변수 a 자체를 삭제
a

NameError: name 'a' is not defined

In [56]:
# A.index(x)는 리스트 A에서 항목 x의 인덱스를 반환
people = ['버피', '페이스']
people.index('버피')

0

In [57]:
# A.count(x)는 리스트 A에 항목 x가 몇 개 들어 있는지 개수 반환
people = ["버피", "페이스", "버피"]
people.count("버피")

2

In [58]:
# A.sort(key, reverse): 인수가 없으면 오름차순 정렬
people = ["젠더", "페이스", "버피"]
people.sort()
people

['버피', '젠더', '페이스']

In [59]:
people.sort(reverse=True)
people

['페이스', '젠더', '버피']

In [65]:
import time
timestamp = [
    "2020-04-25 01:17:31",
    "2020-04-25 02:17:28",
    "2020-04-26 06:39:26",
    "2020-04-26 07:30:35",
    "2020-03-15 11:32:33",
    "2020-03-15 12:35:48"
]
def time_format(t):
    return time.strptime(t, '%Y-%m-%d %H:%M:%S')[0:6]

In [66]:
timestamp.sort(key=time_format, reverse=True)
timestamp

['2020-04-26 07:30:35',
 '2020-04-26 06:39:26',
 '2020-04-25 02:17:28',
 '2020-04-25 01:17:31',
 '2020-03-15 12:35:48',
 '2020-03-15 11:32:33']

In [67]:
timestamp.sort(key=lambda x: time.strptime(x, '%Y-%m-%d %H:%M:%S')[0:6], reverse=True)
timestamp

['2020-04-26 07:30:35',
 '2020-04-26 06:39:26',
 '2020-04-25 02:17:28',
 '2020-04-25 01:17:31',
 '2020-03-15 12:35:48',
 '2020-03-15 11:32:33']

In [68]:
# A.reverse() : 리스트 A의 항목들을 반전시켜서 그 변수에 적용
# list[::-1]와 같다

people = ["젠더", "페이스", "버피"]
people.reverse()
people

['버피', '페이스', '젠더']

In [69]:
people[::-1]

['젠더', '페이스', '버피']

### 2.4.2 리스트 언패킹

In [70]:
first, *rest = [1, 2, 3, 4, 5]
first

1

In [71]:
rest

[2, 3, 4, 5]

In [72]:
def example_args(a, b, c):
    return a*b*c    # 여기에서 * 연산자는 곱셈

L = [2, 3, 4]
example_args(*L)  # 리스트 언패킹

24

In [73]:
example_args(2, *L[1:])

24

### 2.4.3 리스트 컴프리헨션
* 반복문의 표현식
* [ 항목 for 항목 in 반복 가능한 객체 ]
* [ 표현식 for 항목 in 반복 가능한 객체 ]
* [ 표현식 for 항목 in 반복 가능한 객체 if 조건문 ]

In [74]:
a = [y for y in range(1900, 1940) if y%4 == 0]
a

[1900, 1904, 1908, 1912, 1916, 1920, 1924, 1928, 1932, 1936]

In [75]:
b = [2**i for i in range(13)]
b

[1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096]

In [76]:
c = [x for x in a if x%2 == 0]
c

[1900, 1904, 1908, 1912, 1916, 1920, 1924, 1928, 1932, 1936]

In [77]:
d = [str(round(355/113.0, i)) for i in range(1, 6)]
d

['3.1', '3.14', '3.142', '3.1416', '3.14159']

In [78]:
words = 'Buffy is awesome and a vampire slayer'.split()
e = [[w.upper(), w.lower(), len(w)] for w in words]
for i in e:
    print(i)

['BUFFY', 'buffy', 5]
['IS', 'is', 2]
['AWESOME', 'awesome', 7]
['AND', 'and', 3]
['A', 'a', 1]
['VAMPIRE', 'vampire', 7]
['SLAYER', 'slayer', 6]


### 2.4.4 리스트 메서드 성능 측정

In [79]:
def test1():
    l = []
    for i in range(1000):
        l = l + [i]
        
def test2():
    l = []
    for i in range(1000):
        l.append(i)
        
def test3():
    l = [i for i in range(1000)]
    
def test4():
    l = list(range(1000))
    

if __name__ == "__main__":
    import timeit
    t1 = timeit.Timer("test1()", "from __main__ import test1")
    print("concat ", t1.timeit(number=1000), "ms")
    
    t2 = timeit.Timer("test2()", "from __main__ import test2")
    print("append ", t2.timeit(number=1000), "ms")
    
    t3 = timeit.Timer("test3()", "from __main__ import test3")
    print("comprehension ", t3.timeit(number=1000), "ms")
    
    t4 = timeit.Timer("test4()", "from __main__ import test4")
    print("list range ", t4.timeit(number=1000), "ms")

concat  5.267569900001035 ms
append  0.3747992000007798 ms
comprehension  0.17418039999938628 ms
list range  0.04869379999945522 ms


## 2.5 바이트와 바이트 배열
* 불변 타입의 바이트(byte)와 가변 타입의 바이트 배열(bytearray)을 제공
* 둘다 0~255 범위의 부호 없는 8비트 정수 시퀀스로 이뤄짐

In [80]:
blist = [1, 2, 3, 255]
the_bytes = bytes(blist)
the_bytes

b'\x01\x02\x03\xff'

In [81]:
the_byte_array = bytearray(blist)
the_byte_array

bytearray(b'\x01\x02\x03\xff')

In [82]:
the_bytes[1] = 127  # immutable

TypeError: 'bytes' object does not support item assignment

In [83]:
the_byte_array[1] = 127 # mutable
the_byte_array

bytearray(b'\x01\x7f\x03\xff')

### 2.5.1 비트와 비트 연산자

In [84]:
x = 4
1 << x ## 1을 x번 만큼 왼쪽으로 이동, 즉 2^x의 의미

16

In [86]:
x = 4
x & (x - 1)
# x는 4, 즉 2진법으로 100
# x-1은 3, 즉 2진법으로 011
# 100 AND(&) 011은 0

0

In [88]:
x = 6
x & (x - 1)
# 6는 2진법으로 110
# 5는 2진법으로 101
# 110 & 101은 100

4

## 2.6 연습문제

### 2.6.1 문자열 전체 반전하기

In [1]:
def revert(s):
    if s:
        s = s[-1] + revert(s[:-1])
    return s

def revert2(string):
    return string[::-1]

str1 = "안녕 세상!"
print(revert(str1))
print(revert2(str1))

!상세 녕안
!상세 녕안


### 2.6.2 문자열 단어 단위로 반전하기
* 파이썬 문자열은 불변 타입, 리스트를 사용하여 문제 해결
* 리스트 및 문자열 메서드 대신 포인터 사용 가능
* 포인터 사용 시 두 개의 반복문으로 구성
* 첫번째 반복문은 두 포인터를 사용하여 전체 문장을 반전
* 두번째 반복문에서는 공복을 만났을 때 각 단어를 다시 반전

In [5]:
def reverser(string1, p1=0, p2=None):
    if len(string1) < 2:
        return string1
    p2 = p2 or len(string1) - 1
    while p1 < p2:
        string1[p1], string1[p2] = string1[p2], string1[p1]
        p1 += 1
        p2 -= 1
        
def reversing_words_sentence_logic(string1):
    # 먼저, 문장 전체를 반전한다.
    reverser(string1)
#     print(string1)
    p = 0
    start = 0
    while p < len(string1):
        if string1[p] == u"\u0020":
            # 단어를 다시 반전한다(단어를 원위치로 돌려놓는다).
            reverser(string1, start, p-1)
            print(string1)
            start = p+1
        p += 1
    # 마지막 단어를 반전한다(단어를 원위치로 돌려놓는다).
    reverser(string1, start, p-1)
    # print(string1)
    return "".join(string1)

str1 = "파이썬 알고리즘 정말 재미있다"
str2 = reversing_words_sentence_logic(list(str1))
print(str2)
    

['재', '미', '있', '다', ' ', '말', '정', ' ', '즘', '리', '고', '알', ' ', '썬', '이', '파']
['재', '미', '있', '다', ' ', '정', '말', ' ', '즘', '리', '고', '알', ' ', '썬', '이', '파']
['재', '미', '있', '다', ' ', '정', '말', ' ', '알', '고', '리', '즘', ' ', '썬', '이', '파']
재미있다 정말 알고리즘 파이썬


In [1]:
# 단어 단위로 나눠 리스트에 추가한 후, 리스트를 반전
def reverse_words_brute(string):
    word, sentence = [], []
    for character in string:
        if character != " ":
            word.append(character)
        else:
            # 조건문에서 빈 리스트는 False다. 여러 공백이 있는 경우, 조건문을 건너뛴다.
            if word:
                sentence.append("".join(word))
            word = []
    
    # 마지막 단어가 있다면, 문장에 추가
    if word != "":
        sentence.append("".join(word))
    sentence.reverse()
    return " ".join(sentence)

str1 = "파이썬 알고리즘 정말 재미있다"
str2 = reverse_words_brute(str1)
str2

'재미있다 정말 알고리즘 파이썬'

In [3]:
# 문자열을 공백으로 구분해서 리스트 생성 후, 슬라이스 사용
def reversing_words_slice(word):
    new_word = []
    words = word.split(" ")
    for word in words[::-1]:
        new_word.append(word)
    return " ".join(new_word)

str1 = "파이썬 알고리즘 정말 재미있다"
str2 = reversing_words_slice(str1)
str2

'재미있다 정말 알고리즘 파이썬'

In [4]:
# 반복문 없이 리스트와 문자열 메서드만으로 해결
def reversing_words(str1):
    words = str1.split(" ")
    rev_set = " ".join(reversed(words))
    return rev_set

def reversing_words2(str1):
    words = str1.split(" ")
    words.reverse()
    return " ".join(words)

str1 = "파이썬 알고리즘 정말 재미있다"
str2 = reversing_words(str1)
str3 = reversing_words(str1)
print(str2)
print(str3)

재미있다 정말 알고리즘 파이썬
재미있다 정말 알고리즘 파이썬


### 2.6.3 단순 문자열 압축

In [5]:
# aabcccccaaa를 a2b1c5a3 같은 형식으로 압축하는 예제
def str_compression(s):
    count, last = 1, ""
    list_aux = []
    for i, c in enumerate(s):
        if last == c:
            count += 1
        else:
            if i != 0:
                list_aux.append(str(count))
            list_aux.append(c)
            count = 1
            last = c
            
    list_aux.append(str(count))
    return "".join(list_aux)

result = str_compression("aabcccccaaa")
result

'a2b1c5a3'

### 2.6.4 문자열 순열
* 순열(permutation)은 서로 다른 n개 중 r개를 골라 순서를 고려해 나열한 경우의 수

In [7]:
# 길이 n의 문자열에서 n개 문자를 모두 선택하는 경우의 문자열을 나열
import itertools

def perm(s):
    if len(s) < 2:
        return s
    res = []
    for i, c in enumerate(s):
        for cc in perm(s[:i] + s[i+1:]):    # 이해안됨
            res.append(c + cc)
    return res

def perm2(s):
    res = itertools.permutations(s)
    print(res)
    return ["".join(i) for i in res]

val = "012"
print(perm(val))
print(perm2(val))

['012', '021', '102', '120', '201', '210']
<itertools.permutations object at 0x000001A554B7F048>
['012', '021', '102', '120', '201', '210']


In [8]:
# n 이하의 수에 대해서 모든 순열의 경우
def combinations(s):
    if len(s) < 2:
        return s
    res = []
    for i, c in enumerate(s):
        res.append(c)  # 추가된 부분
        for j in combinations(s[:i] + s[i+1:]):
            res.append(c + j)
    return res

result = combinations("abc")
result

['a',
 'ab',
 'abc',
 'ac',
 'acb',
 'b',
 'ba',
 'bac',
 'bc',
 'bca',
 'c',
 'ca',
 'cab',
 'cb',
 'cba']

### 2.6.5 회문
* 회문(palindrome)이란 앞에서부터 읽으나 뒤에서부터 읽으나 동일한 단어나 구

In [9]:
def is_palindrome(s):
    l = s.split(" ")
    s2 = "".join(l)
    return s2 == s2[::-1]

def is_palindrome2(s):
    l = len(s)
    f, b = 0, l-1
    while f < l//2:
        while s[f] == " ":
            f += 1
        while s[b] == " ":
            b -= 1
        if s[f] != s[b]:
            return False
        f += 1
        b -= 1
    return True

def is_palindrome3(s):
    s = s.strip()
    if len(s) < 2:
        return True
    if s[0] == s[-1]:
        return is_palindrome3(s[1:-1])
    else:
        return False
    
str1 = "다시 합창합시다"
str2 = ""
str3 = "hello"

print(is_palindrome(str1))
print(is_palindrome(str2))
print(is_palindrome(str3))
print()
print(is_palindrome2(str1))
print(is_palindrome2(str2))
print(is_palindrome2(str3))
print()
print(is_palindrome3(str1))
print(is_palindrome3(str2))
print(is_palindrome3(str3))
print()


True
True
False

True
True
False

True
True
False

