## 1.리스트
* 파이썬 리스트는 순서대로 저장하는 시퀀스이자 변경 가능한 목록을 말한다.
* 입력 순서가 유지되며, 내부적으로 동적 배열로 구현되어 있다.
* 파이썬 리스트의 가장 좋은 점은 매우 다양한 기능을 제공한다는 점이다.
    * 이 기능 중 O(1) 에 해당하는 기능 .append() , .pop() 이있다.
* 반면 요소를 삭제하거나 큐의 연산이기도 한 첫 번째 요소를 추출하는 .pop(0) 는 O(n) 이므로 큐의 연산을 사용할 때는 주의가 필요하다. 이 때는 데크 같은 자료형으로 성능을 높일 수 있다.
* 리스트의 경우 탐색 시 값의 존재 유무를 확인하려면 정렬된 경우에는 이진 검색이 효울적이다. 그러나 매번 정렬이 필요하고 대개는 리스트가 정렬된 상태가 이니므로 리스트의 경우에는 모든 엘리먼트를 순차적으로 조회하는 형태로 구현되어 있다. (이 경우 최악은 항상 O(n) 이 소요된다.)

## 2. 딕셔너리
* 파이썬 딕셔너리는 키/값 구조로 이루어져 있다.
* 3.7+ 부터 입력 순서가 유지되며 내부적으로 해시 테이블로 구현되어 있다.
* 인덱스를 숫자로만 지정할 수 있는 리스트와 다르게 딕셔너리는 해시할 수만 있다면 숫자뿐만 아니라, 문자 집합까지 불변 객체를 모두 키로 사용할 수 있다. 
    * 이 과정을 해싱이라고 하며, 해시 테이블을 이용해 자료를 저장한다.
* 딕셔러니는 대부분의 연산이 O(1) 에 처리 가능한 매우 우수한 자료형이다.
* 파이썬 딕셔너리를 효율적으로 생성하기 위한 추가 모듈이 많이 있다.

## 딕셔너리 활용과 모듈
* 딕셔너리와 관련된 특수한 형태의 컨테이너 자료형인 defaultdict, Counter, OrderedDict 에 대해 살펴보면 아래와 같다.
### defaultdict 객체
* defaultdict 객체는 존재하지 않는 키를 조회할 경우, 에러 메시지를 출력하는 대신 디폴트 값을 기준으로 해당 키에 대한 딕셔너리 아이템을 생성해준다.
* 아래 예시처럼 존재하지 않는 키에 대해 바로 연산이 가능하고 이 int 로 할 경우에 디폴트인 0을 기준으로 자동 생성후에 연산이 되는 것을 볼 수 있다.

In [1]:
from collections import defaultdict, Counter, OrderedDict

In [2]:
a =defaultdict(int)
a['A']= 5
a['B']= 4
a

defaultdict(int, {'A': 5, 'B': 4})

In [3]:
a['C']+=1
a

defaultdict(int, {'A': 5, 'B': 4, 'C': 1})

### Counter 객체
* Counter 객체는 아이템에 대한 개수를 계산해 딕셔너리로 반환한다.

In [4]:
a = [1,1,1,1,2,2,2,2,3,3,4,4,5,6,7]
b = Counter(a)
b

Counter({1: 4, 2: 4, 3: 2, 4: 2, 5: 1, 6: 1, 7: 1})

In [5]:
type(b)

collections.Counter

* most_common() 과같은 매서드로 가장 빈도수가 높은 요소를 추출할 수 있다.
    * 그 밖에도 값의 합산을 구하는 .total() , 특정 키를 기준으로 빼기 연산을 하는 .subtract() 매서드가 있다.

In [8]:
b.most_common(1)

[(1, 4)]

### OrderdDcit 객체
* 파이썬 3.6 이하에서는 입력 순서가 유지되는 OrderedDict 라는 별도의 객체를 제공했다.
* 그 이후 버전부터는 딕셔너리 내부적으로 인덱스를 이용해 입력순서가 유지되도록 개선되었다.

----
# 문자열 조작
## 1. 유효한 팰린드롬
* 주어진 문자열이 팰린드롬인지 확인하라. 대소문자를 구분하지 않으며 영문자와 숫자만을 대상으로 한다.
    * 팰린드롬은 앞뒤가 똑같은 단어나 문장으로 뒤집어도 같은 말이 되는 단어 또는 문장을 의미한다.

In [23]:
# my answer
import re
def is_palindrome(s):
    pat = re.compile('\w')
    s_pat = "".join(pat.findall(s))
    if s_pat.lower() == s_pat.lower()[::-1]:
        return True
    else:
        return False

In [24]:
s1 = "A man, a plan, a canal: Panama"
s2 = "race a car"

In [26]:
print(is_palindrome(s1))
print(is_palindrome(s2))

True
False


### 풀이-1
* 대소문자 여부를 구분하지 않고 영문자, 숫자만을 대상으로 한다는 제약 조건의 처리는 아래와 같이 구현한다.
* 그 이후에 pop 함수를 통해 인덱스를 지정해 맨앞의 값과 맨 뒤에 값을 가져오는 반복으로 팰린드롬을 판별한다.


In [27]:
strs = []
for char in s1:
    if char.isalnum():
        strs.append(char.lower())
strs

['a',
 'm',
 'a',
 'n',
 'a',
 'p',
 'l',
 'a',
 'n',
 'a',
 'c',
 'a',
 'n',
 'a',
 'l',
 'p',
 'a',
 'n',
 'a',
 'm',
 'a']

In [29]:
while len(strs) > 1:
    if strs.pop(0) != strs.pop():
        print(False)
        # return False

* 전체 코드를 정리하면 아래와 같다.

In [30]:
def is_palindrome(self, s:str) -> bool:    
    strs = []
    for char in s:
        if char.isalnum():
            strs.append(char.lower())
    while len(strs) > 1:
        if strs.pop(0) != strs.pop():
            print(False)
    return True

In [33]:
is_palindrome(None, s= s1)

True

* 만약 데크Deque 를 명시적으로 선언하면 좀 더 속도를 높일 수 있다.
* strs: Deque = collections.deque() 와 같이 자료형을 데크로 선언하는 것만으로 기존 방식 대비 5배 가까이 더 속도를 높일 수 있다.
    * 리스트 구현은 $O(n^2)$, 데크 구현은 O(n) dmfh tjdsmd ckdlrk zmek.

In [37]:
import collections

def is_palindrome(self, s:str) -> bool:
    strs: Deque = collections.deque()

    for char in s:
        if char.isalnum():
            strs.append(char.lower())

    while len(strs) > 1:
        if strs.popleft() != strs.pop():
            return False
    return True

In [38]:
is_palindrome(None, s1)

True

* 슬라이싱을 사용해 문제 풀이를 할 수 있다.
    * 문자열 전체를 정규식으로 처리해 문자 및 숫자만 포함시킬 수 있다.
    * 리스트ㅡ이 경우 [::-1] 을 이용해 뒤집을 수 ㅣㅇㅆ다. 이는 내부적으로 C로 구현되어 있어 훨씬 더 좋은 속도를 기대할 수 있다.

In [39]:
def is_palindrome(self, s:str) -> bool:
    s = s.lower()
    s = re.sub('[^a-z0-9]', '', s)

    return s == s[::-1]

is_palindrome(None, s1)

True

* 슬라이싱 기능은 매우 편리하면서 대부분의 문자열 작업은 슬라이싱으로 처리하는 편이 가장 빠르다.
    * 아래의 예시를 통해 슬라이싱 결과를 기억하자.

In [40]:
s = "안녕하세요"
print(s[1:4])
print(s[1:-2])
print(s[1:])
print(s[:])
print(s[1:100])
print(s[-1])
print(s[:-3])
print(s[-3:])
print(s[::1])
print(s[::-1])
print(s[::2])

녕하세
녕하
녕하세요
안녕하세요
녕하세요
요
안녕
하세요
안녕하세요
요세하녕안
안하요


## 2. 문자열 뒤집기
* 문자열을 뒤집는 함수를 작성하라. 입력값은 무자 배열이며, 리턴 없이 리스트 내부를 직접 조작하라.
    * 입력 : ["h","e","l","l","o"]
    * 출력 : ["o","l","l","e","h"]

In [7]:
# my answer
def reveres_string(s:list) -> None:
    s.reverse()

In [9]:
l1 = ["h","e","l","l","o"]
reveres_string(l1)
l1

['o', 'l', 'l', 'e', 'h']

### 풀이 1
* 투 포인터를 활용한 전통적인 방식
    * 2개의 포인터를 이용해 범위를 조정해가면 풀이하는 방식
    * 이 문제에서는 양 끝쪽에서 좁혀나가면서 서로 교체(스왑)하는 형식으로 풀이

In [20]:
from typing import List

def reveres_string(self, s:List[str]) -> None:
    left, right = 0, len(s)-1
    while left < right:
        s[left], s[right] = s[right], s[left]
        left += 1
        right -= 1

l1 = ["h","e","l","l","o"]
reveres_string(None,s=l1)
l1

['o', 'l', 'l', 'e', 'h']

In [None]:
# pythonic
def reveres_string(self, s:List[str]) -> None:
    s.reverse()

## 3. 로그 파일 재정렬