# Ch4

## 불변/가변 객체

In [235]:
10

10

In [236]:
a = 10

In [237]:
b = a

In [238]:
print(id(10), id(a), id(b))

94708996008736 94708996008736 94708996008736


불변 객체: 숫자, 문자, tuple

In [239]:
a = [1, 2, 3, 4, 5]

In [240]:
b = a

In [241]:
b

[1, 2, 3, 4, 5]

In [242]:
a[2]=4

In [243]:
a

[1, 2, 4, 4, 5]

In [244]:
b

[1, 2, 4, 4, 5]

b는 a를 할당하여 참조. a가 변경될 시 b도 변경됨 -> 리스트가 가변 객체

In [245]:
a = 10

In [246]:
b = a

In [247]:
print(id(a), id(b))

94708996008736 94708996008736


In [248]:
b = 7

In [249]:
print(a, id(a), id(b))

10 94708996008736 94708996008640


C++과 달리 파이썬은 참조한 변수가 새로운 값을 가지게 되면 참조 관계가 끊어진다.

b의 id는 a와 달라지고, a는 b의 변화와 상관없이 동일값을 가지고 있다.

## is 와 ==

In [250]:
if a is None:
  pass

- is: id()값을 비교
- None은 null로 값 자체가 정의되어 있지 않아 ==로 비교 불가, is로만 비교

In [251]:
a = [1, 2, 3]

In [252]:
list(a)

[1, 2, 3]

In [253]:
a == a

True

In [254]:
a == list(a)

True

In [255]:
a is a

True

In [256]:
a is list(a)

False

In [257]:
print(id(a), id(list(a)))

140010443382688 140010443321424


In [258]:
a is [a] # list()와 []작동 방식이 같음

False

값은 동일하다.

그러나 list()로 한번 더 묶어주면, 새로운 객체로 복사가 되고 다른 id를 가지게 된다. -> list()는 `새로운 객체`를 만든다.

=> 따라서 is로 확인하면 False가 된다.

In [259]:
a = [1,2,3]

In [260]:
import copy
a == copy.deepcopy(a)

True

In [261]:
a is copy.deepcopy(a)

False

값은 같지만 id가 다르다는 것을 알 수 있다.
- ==으로 값 비교
- is로 id(메모리상의 위치) 비교

# Ch5

## 리스트

- 마지막 요소를 추가/추출: O(1)
- 원하는 인덱스의 요소 조회: O(1)
- 첫번째 요소 추출 `pop(0)`: O(n)
- 리스트에서 큐의 연산을 사용할 시 -> Deque 자료형으로 성능을 높일 수 있음
- 마치 원시 타입인 `배열`과 `연결 리스트`를 합친 듯한 기능을 함
- 그러나 이 기능을 위해 리스트에 각 요소(객체)에 대한 `참조`를 넣기 때문에 속도가 느림

In [262]:
a = [1,2,3,4,5]
try:
  print(a[6])
except IndexError:
  print("존재하지 않는 인덱스")

존재하지 않는 인덱스


In [263]:
a.remove(3)

In [264]:
a

[1, 2, 4, 5]

## 딕셔너리
- 내부적으로 Hash Table로 구현
- 불변 객체를 모두 key로 사용 가능
- 입력과 조회 모두 O(1)
- 최악의 경우 O(n)이지만 대부분 빨리 실행 됨
- 분할 상환 분석시 시간 복잡도는 O(1)
- version 3.7 이후로 입력 순서 유지
- version 3.6+ 이후로 메모리 사용량 20% 감소
- 유용 모듈
  - `collections.OrderDict()`: 입력 순서가 항상 유지
  - `collections.defaultdict()`: 조회시 항상 디폴트 값을 생성해 키 오류 방지
  - `collections.Counter()`: 요소의 값을 키로 하고 개수를 값 형태로 만들어 카운팅
  

In [265]:
a = {'key1':'value1',
     'key2':'value2',
     'key3':'value3'}
try:
  print(a['key4'])
except KeyError:
  print("존재하지 않는 키")

존재하지 않는 키


## defaultdict
- 존재하지 않는 키를 디폴트 값으로 해당 키에 대한 딕셔너리 아이템을 생성

In [266]:
import collections
a = collections.defaultdict(int)

In [267]:
a['A'] = 5

In [268]:
a['B'] = 4

In [269]:
a

defaultdict(int, {'A': 5, 'B': 4})

In [270]:
a['C'] += 1

In [271]:
a

defaultdict(int, {'A': 5, 'B': 4, 'C': 1})

## Counter
- key<- 아이템의 값
- value<- 해당 아이템의 개수
- 딕셔너리를 한 번 더 Wrapping한 collections.Counter 클래스를 가짐

In [272]:
a = [1,2,3,4,5,5,5,6,6]

In [273]:
b = collections.Counter(a)

In [274]:
b

Counter({1: 1, 2: 1, 3: 1, 4: 1, 5: 3, 6: 2})

In [275]:
type(b)

collections.Counter

In [276]:
b.most_common(2) # 빈도수 높은 요소 추출

[(5, 3), (6, 2)]

## OrderedDict
- 대부분 해시 테이블을 이용한 자료형은 입력 순서 유지 안됨
- OrderedDict를 이용해서 입력 순서 유지 가능
- version 3.7 이후로는 내부적으로 입력 순서 유지되도록 개선

In [277]:
!python --version

Python 3.7.12


## 타입 선언

In [278]:
type([])

list

In [279]:
type(())

tuple

In [280]:
type({})

dict

In [281]:
type({1})

set

# Ch6

## 1. 유효한 팰린드롬
https://leetcode.com/problems/valid-palindrome/


In [282]:
input1 = "A man, a plan, a canal: Panama"
input2 = "race a car"

### 1-1. 리스트로 변환

In [283]:
class Solution:
    def isPalindrome(self, s:str) -> bool:
        strs = []
        for char in s:
            if char.isalnum():
                strs.append(char.lower())
        while len(strs) > 1:
            if strs.pop(0) != strs.pop():
                return False

        return True

In [284]:
solution = Solution()
output = solution.isPalindrome(input1)
output

True

In [285]:
output = solution.isPalindrome(input2)
output

False

### 1-2. 데크 자료형을 이용한 최적화
- list의 `pop(0)` : O(n)
- deque의 `popleft()` : O(1)

In [286]:
class Solution:
    def isPalindrome(self, s:str) -> bool:
        strs: Deque = collections.deque()

        for char in s:
            if char.isalnum():
                strs.append(char.lower())

        while len(strs) > 1:
            if strs.popleft() != strs.pop():
                return False
        return True

In [287]:
solution = Solution()
output = solution.isPalindrome(input1)
output

True

In [288]:
output = solution.isPalindrome(input2)
output

False

### 1-3. 슬라이싱 사용
- 한번에 영숫자 Alphanumeric 만 걸러내도록 정규식 처리
- 문자열 조작 시, 슬라이싱을 우선으로 사용하는 것이 속도 개선에 유리

In [289]:
import re

class Solution:
    def isPalindrome(self, s:str) -> bool:
        s = s.lower()
        s = re.sub('[^a-z0-9]', '', s)
        return s ==s[::-1]

In [290]:
solution = Solution()
output = solution.isPalindrome(input1)
output

True

In [291]:
output = solution.isPalindrome(input2)
output

False

## 2. 문자열 뒤집기

https://leetcode.com/problems/reverse-string/
- return 없이 리스트 내부를 직접 조작

In [292]:
input1 = ["h","e","l","l","o"]
input2 = ["H","a","n","n","a","h"]

### 2-1. 투 포인터를 이용한 스왑
- input s의 내부를 스왑하는 형태

In [293]:
from typing import List # typing 모듈로 타입 명시

class Solution:
    def reverseString(self, s: List[str]) -> None:
        left, right = 0, len(s)-1
        while left < right:
            # print(left, right)
            # print(s[left])
            s[left], s[right] = s[right], s[left]
            left += 1
            right -= 1

In [294]:
solution = Solution()
solution.reverseString(input1)
input1

['o', 'l', 'l', 'e', 'h']

In [295]:
solution.reverseString(input2)
input2

['h', 'a', 'n', 'n', 'a', 'H']

### 2.2 파이썬다운 방식

In [296]:
class Solution:
    def reverseString(self, s: List[str]) -> None:
        s.reverse()

In [297]:
solution = Solution()
solution.reverseString(input1)
input1

['h', 'e', 'l', 'l', 'o']

In [298]:
solution.reverseString(input2)
input2

['H', 'a', 'n', 'n', 'a', 'h']

### 2.3 [::-1] 트릭
- 리트코드에서 공간 복잡도를 O(1)로 제한하여 변수 할당을 처리하는데 제약이 있음

In [299]:
input3 = "Python"
input3 = [i for i in input3]
input3[:] = input3[::-1]

In [300]:
input3

['n', 'o', 'h', 't', 'y', 'P']

In [301]:
class Solution:
    def reverseString(self, s: List[str]) -> None:
        s[:]=s[::-1]

In [302]:
solution = Solution()
solution.reverseString(input1)
input1

['o', 'l', 'l', 'e', 'h']

In [303]:
solution.reverseString(input2)
input2

['h', 'a', 'n', 'n', 'a', 'H']

In [304]:
input4 = ['n', 'o', 'h', 't', 'y', 'P']
solution.reverseString(input4)
input4

['P', 'y', 't', 'h', 'o', 'n']

## 3. 로그파일 재정렬

https://leetcode.com/problems/reorder-data-in-log-files/

- 맨 앞: 식별자
- 문자 로그가 숫자로그보다 앞
- 문자 로그가 동일하면(art) 식별자 순으로
- 숫자 로그는 입력 순서대로 


In [305]:
input1 = ["dig1 8 1 5 1","let1 art can","dig2 3 6","let2 own kit dig","let3 art zero"]
input2 = ["a1 9 2 3 1","g1 act car","zo4 4 7","ab1 off key dog","a8 act zoo"]

### 3-1. 람다와 + 연산자를 이용

In [306]:
class Solution:
    def reorderLogFiles(self, logs: List[str]) -> List[str]:
        letters, digits = [], []
        for log in logs:
            print(log.split()[1])
            if log.split()[1].isdigit():
                digits.append(log)
            else:
                letters.append(log)

        letters.sort(key=lambda x: (x.split()[1:], x.split()[0]))
        return letters + digits

In [307]:
solution = Solution()
output = solution.reorderLogFiles(input1)
output

8
art
3
own
art


['let1 art can',
 'let3 art zero',
 'let2 own kit dig',
 'dig1 8 1 5 1',
 'dig2 3 6']

In [308]:
output = solution.reorderLogFiles(input2)
output

9
act
4
off
act


['g1 act car', 'a8 act zoo', 'ab1 off key dog', 'a1 9 2 3 1', 'zo4 4 7']

### 람다 표현식
- 식별자 없이 실행 가능한 함수

In [309]:
s = ["2 A", "1 B", "4 C", "1 A"]

In [310]:
sorted(s)

['1 A', '1 B', '2 A', '4 C']

In [311]:
def func(x):
    return x.split()[1], x.split()[0]

In [312]:
s.sort(key=func)

In [313]:
s

['1 A', '2 A', '1 B', '4 C']

In [314]:
s.sort(key=lambda x: (x.split()[1], x.split()[0]))

In [315]:
s

['1 A', '2 A', '1 B', '4 C']

## 4. 가장 흔한 단어

https://leetcode.com/problems/most-common-word/

In [316]:
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]

### 4.1 리스트 컴프리헨션, Counter 객제 사용

In [317]:
result = re.sub(r'[^\w]', ' ', paragraph)
result

'Bob hit a ball  the hit BALL flew far after it was hit '

In [318]:
class Solution:
    def mostCommonWord(self, paragraph: str, banned: List[str]) -> str:
        words = [word for word in re.sub(r'[^\w]', ' ', paragraph).lower().split() if word not in banned]
        counts = collections.Counter(words)
        return counts.most_common(1)[0][0]

In [319]:
solution = Solution()
output = solution.mostCommonWord(paragraph, banned)
output

'ball'

## 5. 그룹 애너그램

https://leetcode.com/problems/group-anagrams/

In [320]:
input = ["eat","tea","tan","ate","nat","bat"]

### 5-1. 정렬하여 딕셔너리에 추가

In [321]:
class Solution:
    def groupAnagram(self, strs: List[str]) -> List[List[str]]:
        anagrams = collections.defaultdict(list)

        for word in strs:
            anagrams[''.join(sorted(word))].append(word)
        return anagrams.values()

In [322]:
solution = Solution()
output = solution.groupAnagram(input)
output

dict_values([['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']])

### 여러가지 정렬

sorted()

In [323]:
b = 'sbifx'
"".join(sorted(b))

'bfisx'

In [324]:
c = ["ccc", "qwje", "aaaaaa", "jz"]
sorted(c, key=len)

['jz', 'ccc', 'qwje', 'aaaaaa']

In [325]:
a = ["cde", "cfc", "abc"]
def fn(s):
    return s[0], s[-1]

print(sorted(a, key=fn))

['abc', 'cfc', 'cde']


In [326]:
sorted(a, key=lambda s: (s[0], s[-1])) # lambda input: return 

['abc', 'cfc', 'cde']

list 내장 메소드 sort()는 In-place Sort로 별도의 추가 공간 필요 없음, 리턴 값 없음

In [327]:
a = ["3", "a", "b", "ㄱ", "_"]
a.sort()
a

['3', '_', 'a', 'b', 'ㄱ']

### [Timsort](https://d2.naver.com/helloworld/0315536)

## 6. 가장 긴 팰린드롬 부분 문자열

https://leetcode.com/problems/longest-palindromic-substring/

In [328]:
input1 = "babad"
input2 = "cbbd"

### 6.1 중앙을 중심으로 확장하는 풀이
- 최장 공통 부분 문자열 문제
    - 다이나믹 프로그래밍으로 풀수 있음 
- 좀 더 직관적인 풀이인 투 포인터가 중앙을 중심으로 확장하는 형태
- 짝수, 홀수 투 포인터 이동

In [341]:
class Solution:
    def longestPalindrome(self, s: str) -> str:

        def expand(left: int, right: int) -> str:
            while left >= 0 and right <= len(s) and s[left] == s[right -1]:
                left -= 1
                right += 1
            return s[left + 1:right - 1]

        if len(s) < 2 or s == s[::-1]:
            # filtering
            return s
        
        result = ""

        for i in range(len(s) - 1):
            # move to right
            print(i)
            result = max(result,
                         expand(i, i+1),
                         expand(i, i+2),
                         key=len)
            print(expand(i, i+1),"|", expand(i, i+2), "|", result)
            print("-"*30)
        return result

In [342]:
solution = Solution()
output = solution.longestPalindrome(input1)
output

0
b |  | b
------------------------------
1
bab |  | bab
------------------------------
2
aba |  | bab
------------------------------
3
a |  | bab
------------------------------


'bab'

In [343]:
output = solution.longestPalindrome(input2)
output

0
c |  | c
------------------------------
1
b | bb | bb
------------------------------
2
b |  | bb
------------------------------


'bb'