# 파이썬 알고리즘 인터뷰

## 2부. 파이썬

### 6장. 문자열 조작

---
#### 01. 유효한 팰린드롬(Valid Palindrome)
주어진 문자열이 팰린드롬인지 확인하라. 대소문자를 구분하지 않으며, 영문자와 숫자만을 대상으로 한다.

##### 나의 풀이

In [7]:
# 예제 1
# 입력 : "A man, a plan, a canal: Panama"
# 출력 : true

import re

# 입력
input_sentence = "A man, a plan, a canal: Panama"

# 영문자와 숫자만 남기고 제거 후 소문자로 변환
origin_sentence = re.sub('[^a-zA-Z0-9]', '', input_sentence).lower()

# 문자열 뒤집기
reverse_sentence = origin_sentence[::-1]

# 문자열 비교 후 결과 출력
print("true") if origin_sentence == reverse_sentence else print("false")

true


In [3]:
# 예제 2
# "race a car"
# false

import re

# 입력
input_sentence = "race a car"

# 영문자와 숫자만 남기고 제거 후 소문자로 변환
origin_sentence = re.sub('[^a-zA-Z0-9]', '', input_sentence).lower()

# 문자열 뒤집기
reverse_sentence = origin_sentence[::-1]

# 문자열 비교 후 결과 출력
print("true") if origin_sentence == reverse_sentence else print("false")

false


##### 풀이 1. 리스트로 변환

In [4]:
def isPalindrome(self, s: str) -> bool:
    strs = []
    for char in s:
        if char.isalnum():
            strs.append(char.lower())

    # 팰린드롬 여부 판별
    while len(strs) > 1:
        if strs.pop(0) != strs.pop():
            return False

    return True

##### 풀이 2. 데크 자료형을 이용한 최적화

In [5]:
def isPalindrome(self, s: str) -> bool:
    # 자료형 데크로 선언
    strs: Deque = collections.deque()

    for char in s:
        if char.isalnum():
            strs.append(char.lower())

    while len(strs) > 1:
        if strs.popleft() != strs.pop():
            return False

    return True

##### 풀이 3. 슬라이싱 사용

In [6]:
def isPalindrome(self, s: str) -> bool:
    s = s.lower()
    # 정규식으로 불필요한 문자 필터링
    s = re.sub('[^a-z0-9]', '', s)

    return s == s[::-1]  # 슬라이싱

---
#### 02. 문자열 뒤집기(Reverse String)
문자열을 뒤집는 함수를 작성하라. 입력값은 문자 배열이며, 리턴 없이 리스트 내부를 직접 조작하라.
- 예제 1
    - 입력 : `["h", "e", "l", "l", "o"]`
    - 출력 : `["o", "l", "l", "e", "h"]`<br><br>
- 예제 2
    - 입력 : `["H", "a", "n", "n", "a", "h"]`
    - 출력 : `["h", "a", "n", "n", "a", "H"]`

##### 나의 풀이

In [25]:
def reverse_string(s: list):
    for i in reversed(range(len(s)-1)):
        s.append(s.pop(i))


input_list = ["h", "e", "l", "l", "o"]
reverse_string(input_list)
print(input_list)

['o', 'l', 'l', 'e', 'h']


##### 풀이 1. 투 포인터를 이용한 스왑

In [None]:
def reverseString(self, s: List[str]) -> None:
    left, right = 0, len(s)-1
    while left < right:
        s[left], s[right] = s[right], s[left]
        left += 1
        right -= 1

##### 풀이 2. 파이썬다운 방식

In [None]:
def reverseString(self, s: List[str]) -> None:
    s.reverse()

---
#### 03. 로그 파일 재정렬 (Reorder Log Files)
로그를 재정렬하라. 기준은 다음과 같다.
1. 로그의 가장 앞 부분은 식별자다.
2. 문자로 구성된 로그가 숫자 로그보다 앞에 온다.
3. 식별자는 순서에 영향을 끼치지 않지만, 문자가 동일할 경우 식별자 순으로 한다.
4. 숫자 로그는 입력 순서대로 한다.
- 입력
    - `log = ["dig1 8 1 5 1", "let1 art can", "dig2 3 6", "let2 own kit dig", "let3 art zero"]`
- 출력
    - `["let1 art can", "let3 art zero", "let2 own kit dig", "dig1 8 1 5 1", "dig2 3 6"]`

> 리트코드 원문과 내용이 달라 코드 작성에 어려움을 겪음.

##### 풀이 1. 람다와 + 연산자를 이용

In [None]:
def reorderLogFiles(self, logs: List[str]) -> List[str]:
    letters, digits = [], []
    for log in logs:
        if log.split()[1].isdigit():
            digits.append(log)
        else:
            letters.append(log)

    # 2개의 키를 람다 표현식으로 정렬
    letters.sort(key=lambda x: (x.split()[1:], x.split()[0]))
    return letters+digits

---
#### 04. 가장 흔한 단어 (Most Common Word)
금지된 단어를 제외한 가장 흔하게 등장하는 단어를 출력하라. 대소문자 구분을 하지 않으며, 구두점(마침표, 쉼표 등) 또한 무시한다.
- 입력
    - `paragraph = "Bob hit a ball, the hit Ball flew far after it was hit."`
    - `banned = ["hit"]`
- 출력
    - `"ball"`

##### 나의 풀이

In [72]:
import collections
import re

paragraph = "Bob hit a ball, the hit Ball flew far after it was hit"
banned = ["hit"]

sub_paragraph = re.sub(banned[0], '', paragraph)
sub_paragraph = re.sub('[^a-zA-Z0-9 ]', '', sub_paragraph).lower()

cnt = collections.Counter(sub_paragraph.split())
print("\""+cnt.most_common(1)[0][0]+"\"")

"ball"


##### 풀이 1. 리스트 컴프리헨션, Counter 객체 사용

In [None]:
def mostCommonWord(self, paragraph: str, banned: List[str]) -> str:
    words = [word for word in re.sub(
        r'[^\w]', ' ', paragraph).lower().split() if word not in banned]

    counts = collections.Counter(words)
    # 가장 흔하게 등장ㅇ하는 단어의 첫 번째 인덱스 리턴
    return counts.most_common(1)[0][0]

---
#### 05. 그룹 애너그램 (Group Anagrams)
문자열 배열을 받아 애너그램 단위로 그룹핑하라.
- 입력
    - `["eat", "tea", "tan", "ate", "nat", "bat"]`
- 출력
    - ```[
        ["ate", "eat", "tea"],
        ["nat", "tan"],
        ["bat"]
    ]```

##### 나의 풀이

In [252]:
import collections
import re

words = ["eat", "tea", "tan", "ate", "nat", "bat"]
output_list, temp_list = [], []

while words:
    temp_list.append(words.pop())

    for output in output_list:

        if collections.Counter(temp_list[0]) == collections.Counter(output[0]):
            output.append(temp_list.copy()[0])
            temp_list.clear()
            break

    if temp_list:
        output_list.append(temp_list.copy())
        temp_list.clear()

print(output_list)

[['bat'], ['nat', 'tan'], ['ate', 'tea', 'eat']]


##### 풀이 1. 정렬하여 딕셔너리에 추가

In [None]:
def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
    anagrams = collections.defaultdict(list)

    for word in strs:
        # 정렬하여 딕셔너리에 추가
        anagrams[''.join(sorted(word))].append(word)
    return anagrams.values()

---
#### 06. 가장 긴 팰린드롬 부분 문자열
가장 긴 팰린드롬 부분 문자열을 출력하라.
- 예제 1
    - 입력
        - `"babad"`
    - 출력
        - `"bab"`
    - 설명
        - "bab" 외에 "aba"도 정답이다.
- 예제 2
    - 입력
        - `"cbbd"`
    - 출력
        - `"bb"`

##### 나의 풀이