# 파이썬 알고리즘 인터뷰 6장. 문자열 조작

## 팰린드롬 확인

In [1]:
test_str1 = "A man, a plan, a canal: Panama"

test_str2 = "race a car"


In [40]:
def is_palindrome(string: str) -> bool:
    """ Check if the input string is palindrome.
    """
    import re
    
    string = string.lower()
    string = re.sub('[^a-z0-9]', '', string)
    
    if string == string[::-1]:
        return True
    return False

In [41]:
is_palindrome(test_str1)

True

In [42]:
is_palindrome(test_str2)

False

## 문자열 뒤집기

In [44]:
input1 = ['h', 'e', 'l', 'l', 'o']

output1 = ['o', 'l', 'l', 'e', 'h']

input2 = ['H', 'a', 'n', 'n', 'a', 'h']

output2 = ['h', 'a', 'n', 'n', 'a', 'H']

In [51]:
def reverse_string(string_list: list) -> list:
    """ Reverse the string list.
    """
    # use two pointers
    left, right = 0, len(string_list)-1
    while left < right:
        # swap left char with right char
        string_list[left], string_list[right] = string_list[right], string_list[left]
        # move pointers
        left += 1
        right -= 1
    

In [52]:
input1

['h', 'e', 'l', 'l', 'o']

In [53]:
reverse_string(input1)
input1

['o', 'l', 'l', 'e', 'h']

In [54]:
def reverse_string(string_list: list) -> list:
    """ Reverse the string list.
    """
    string_list.reverse()

In [55]:
reverse_string(input2)
input2

['h', 'a', 'n', 'n', 'a', 'H']

In [56]:
input2==output2

True

## 로그 파일 재정렬

In [65]:
logs = ['dig1 8 1 5 1', 'let1 art can', 'dig2 3 6', 'let2 own kit dig', 'let3 art zero']

output = ['let1 art can', 'let3 art zero', 'let2 own kit dig', 'dig1 8 1 5 1', 'dig2 3 6']

In [58]:
# 로그의 가장 앞 부분은 식별자
# 문자로 구성된 로그가 숫자 로그보다 앞에 온다
# 식별자는 순서에 영향을 끼치지 않지만 문자가 동일할 경우 식별자 순으로 한다
# 숫자 로그는 입력 순서대로 한다
from typing import List

def reorder_logs(logs: List[str]) -> List[str]:
    letter_logs, digit_logs = [], []
    # separate letter logs and digit logs
    for l in logs:
        if l.split()[1].isdigit():
            digit_logs.append(l)
        else:
            letter_logs.append(l)
    letter_logs.sort(key=lambda x: (x.split()[1:], x.split()[0]))
    return letter_logs + digit_logs

In [66]:
reorder_logs(logs)

['let1 art can',
 'let3 art zero',
 'let2 own kit dig',
 'dig1 8 1 5 1',
 'dig2 3 6']

In [67]:
reorder_logs(logs) == output

True

## 가장 흔한 단어

In [68]:
paragraph = 'Bob hit a ball, the hit BALL flew far after it was hit.'
banned = ['hit']

In [93]:
# 금지된 단어를 제외한 가장 흔하게 등장하는 단어 반환
# 대소문자 구분 x
# 마침표, 쉼표 등 무시

def most_common_word(paragraph: str, banned: List[str]) -> str:
    """ Return most common word.
    """
    import re
    from collections import Counter
    
    words = [word for word in re.sub(r'[^\w]', ' ', paragraph).lower().split()
             if word not in banned]
    counter = Counter(words)
    return counter.most_common()[0][0]

In [95]:
most_common_word(paragraph, banned)

'ball'

## 그룹 애너그램

In [96]:
input1 = ['eat', 'tea', 'tan', 'ate', 'nat', 'bat']

In [105]:
def anagram(string_list: List[str]) -> List[List[str]]:
    from collections import defaultdict
    anagrams = defaultdict(list)
    for word in string_list:
        key = ''.join(sorted(word))
        anagrams[key].append(word)
    return list(anagrams.values())

In [107]:
anagram(input1)

[['eat', 'tea', 'ate'], ['tan', 'nat'], ['bat']]

## 가장 긴 팰린드롬 부분 문자열

In [108]:
input1 = 'babad'
output1 = 'bab'

input2 = 'cbbd'
output2 = 'bb'

In [109]:
def longest_palindrome(s: str) -> str:
    # use two pointers
    