## String Manipulation

문자열 조작이란, 문자열을 변경하거나 분리하는 등의 여러 과정을 말합니다. <br>
원래 문자열은 로우 레벨에서 조작하거나, C처럼 문자형이 따로 없는 언어에서는 조작이 매우 까다로운 편입니다. <br>
파이썬의 큰 장점이기도 한, 매우 자주 출제되는 문자열 관련 유형들을 다뤄본다. 

## 유효한 팰린드롬

https://leetcode.com/problems/valid-palindrome/

팰린드롬이란...? <br>
앞뒤가 똑같은 단어나 문장으로, 뒤집어도 같은 말이 되는 단어 또는 문장을 팰린드롬(Palindrome)이라고 한다. <br>
우리말로는 '회문'이라고 부르며, 문장 중에서는 대표적으로 '소주 만 병만 주소' 같은 문장이 이에 해당한다. <br>
이 문장은 뒤집어도 같은 문장이 된다. <br>
이러한 팰린드롬의 특징을 응용하면 여러 가지 재미있는 문제들을 많이 만들어낼 수 있기 때문에 코테에 매우 자주 출제된다. <br>

### 시도.

In [48]:
def solution(sen:str)->bool:
    sen.replace(" ","")
    sen = sen.lower()
    result = ""
    for i in range(len(sen)):
        if(sen[i].isalpha()):
            result += sen[i]
            
    # 두 개의 기준점 생성
    left = 0
    right  = len(result)-1
    
    # 팰린드롬 여부 판별
    while(True):
        if(result[left] != result[right]):
            return False
        left += 1
        right -= 1
        if(left > right):
            break
    return True

In [49]:
print(solution("A man, a plan, a canal: panama"))

True


In [50]:
print(solution("race a car"))

False


### 아이디어

문장을 받아와서 예시를 통해서 알 수 있듯이, 빈칸과 대소문자를 통일시킨다. <br>
그 다음에는 기준점을 2개 잡아서 조작해가면서 인덱스별로 비교해가면서 결과를 도출한다. 

In [51]:
# replace 활용 => 빈칸을 없애줄 때 활용함.
# EX) str.replace("필요 없는 것 ","필요한 것")
# upper & lower 활용 => 대소문자 통일 시에 활용함.

### 1. 리스트로 변환 풀이

In [56]:
 def solution(sen:str)->bool:
    temp = []
    for char in sen:
        if char.isalnum():
            temp.append(char.lower())
    
    # 팰린드롬 여부 판별
    while(len(temp) >1):
        if temp.pop(0) != temp.pop():
            return False
    return True

In [53]:
print(solution("A man, a plan, a canal: panama"))

True


In [54]:
print(solution("race a car"))

False


시도했던 풀이는 문자열을 새롭게 정의한 상태로 손대지 않고 확인만 하는 풀이였는데, <br> 
리스트라는 자료구조에 큐 기능을 입혀서 풀이했다.  <br>
다만, pop(0)이라는 것의 특성상 O(n)이라는 것을 고려했을 때, 더 효과적인 코드를 짤 수 있을 듯하다.

### 2. 데큐 자료형을 이용한 최적화

위에서 명시했지만, 리스트만을 이용해서도 충분히 문제를 해결할 수 있지만, <br>
데크(Deque)를 명시적으로 선언하면 좀 더 속도를 높일 수 있다. 

In [57]:
import collections

In [61]:
def solution(sen:str)->bool:
    temp = collections.deque()
    
    for char in sen:
        if char.isalnum():
            temp.append(char.lower())
    
    # 팰린드롬 여부 판별
    while(len(temp) >1):
        if temp.popleft() != temp.pop():
            return False
    return True

In [62]:
print(solution("A man, a plan, a canal: panama"))

True


In [71]:
print(solution("race a car"))

False


데큐 자료형을 사용함으로써 pop(0)의 O(n) 시간 복잡도를 <br>
popleft()의 O(1) 시간 복잡도로 줄일 수 있었다. <br>
결과적으로 단순 리스트를 활용하면 시간복잡도가 n인 행위를 n/2번(pop하다보면 대충) 즉, O(n^2)이 나오고, <br>
데큐 자료형을 활용하면 시간복잡도가 1인 pop행위를 n/2번 즉, O(n)이 걸려서 성능차이를 개선할 수 있다.

### 3. 정규 표현식 & 슬라이싱 활용

In [68]:
import re
def solution(sen:str)->bool:
    sen = sen.lower()
    #정규식으로 불필요한 문자 필터링
    sen = re.sub('[^a-z0-9]','',sen)
    
    return sen == sen[::-1] # 슬라이싱

In [69]:
print(solution("A man, a plan, a canal: panama"))

True


In [70]:
print(solution("race a car"))

False


파이썬은 문자열을 배열이나 리스트처럼 자유롭게 슬라이싱할 수 있는 좋은 기능을 제공한다. <br>
또한 [::-1]을 이용하면 뒤집을 수 있다. <br>
코드가 훨씬 더 줄어듦은 물론, 내부적으로 C로 빠르게 구현되어 있어 훨씬 더 좋은 속도를 기대할 수 있다. <br>
