# Data_Structure in Python 

array, stack, queue, dequeue  
linked list  
hash table  
tree 
graph

###### cf

Big - O 에서 n의 의미 : 입력되는 데이터의 개수 

## 1. Array (배열)


###  C언어에서의 array

array : 연속적인 메모리 공간에 주소를 이용하여 접근하는 자료구조  

따라서 array는 시작주소, 저장된 값의 종류, 인덱스 3가지 만으로 데이터가 저장된 곳을 접근할 수 있다. 

C언어에서 배열의 읽기와 쓰기는 모두 O(1) 시간복잡도를 가진다. 

c언어에서 배열의 셀에는 실제 값이 저장되지만, python에서 배열은 데이터가 아닌 데이터가 저장된 주소가 저장된다.

### python에서의 list, numpy에서의 array

python list의 데이터 저장방식 : 
데이터 주소의 데이터 크기는 모두 하나로 고정되어 있기 때문에 셀의 크기가 같다.  
list는 동적 배열임으로 배열의 크기를 사용자가 신경쓰지 않아도 된다.  
python 내부적으로 list의 크기를 관리하기 때문에 list안에 실제로 저장된 값의 개수를 항상 알고 있어야 하며 추가 정보를 위한 메모리가 필요하다.  
list의 개수가 늘어나거나 줄어드는 연산이 시행되는 경우 list의 모든 값을 옮겨서 다시 할당해야 하기 때문에 상수시간보다 더 걸릴 수 있다. 

수행시간 : 읽기, 쓰기 시간 평균적으로 O(1)  


numpy array의 데이터 저장방식 :
값 직접 저장 (reference 저장방식이 아님, c언와 같이 저장함)  
한 가지 종류의 데이터만 저장 가능함  
메모리를 list보다 적게 사용함  

- python list 특징  
파이썬 list는 숫자형, 문자형 등 모든 자료의 타입을 보존하여 가질 수 있다.  
list는 내부 배열에서 원소 개수가 달라도 됨  
list간 덧셈 연산은 항목을 이어 붙이는 연산이다. 

- numpy list 특징  
numpy array : 숫자형과 문자열이 섞이면 모두 문자열로 전환됨  
array는 내부 배열 내 원소 개수가 모두 같아야 함  
array간 연산은 원소간의 연산을 수행한다. 또한 배열단위의 연산이 매우 빠르기 때문에 빅데이터, 머신러닝 데이터 처리에 적합하다. 
같은 연산을 수행하는 경우 일반적으로 numpy array가 연산 최적화가 잘 되어있다.  



## 2. stack, queue, deque

stack : 후입선출  
queue : 선입선출  
dequeue : stack + queue  

In [1]:
# stack in python 

class Stack : 
    def __init__(self) -> None:
        self.items = []
    
    def push(self,val) : 
        self.items.append(val)
        
    def pop(self) : 
        try : 
            return self.items.pop()
        except IndexError : 
            print("empty")
    
    def top(self) : 
        try : 
            return self.items[-1]
        except IndexError : 
            print("empty")
            
    # __len__ :  len()으로 객체를 호출했을 시 return되는 값을 정해줌 
    def __len__(self) : 
        return len(self.items)

    def isEmpty(self) : 
        return len(self) == 0

In [2]:
s = Stack()
s.push(1)
s.push(2)
print(s.pop())


2


### 스택 활용의 예 

1. 괄호 맞추기
- 왼쪽 괄호가 나오면 push
- 오른쪽 괄호가 나오면 pop
- 주어진 괄호를 모두 처리했으나 stack에 괄호가 남아있거나, pop연산을 했는데 stack에 아무것도 없는 경우 error
- 괄호 짝 맞추기에 스택을 활용할 수 있는 이유 : 
가장 오른쪽에 있는 왼쪽 괄호부터 오른쪽 괄호와 쌍을 이루어야 한다. 
가장 오른쪽에 있다는 것은 가장 나중에 쓰인 것이다. 
따라서 괄호 짝 맞추기는 후입선출 특징을 가지고 있다. 
스택 또한 후입선출의 특징이 있음으로 괄호 짝 맞추기에서 스택 활용이 가능하다. 

2. infix 수식 postfix 수식으로 변환하기
3. postfix 수식 실제로 계산하기 

In [3]:
# 4.left - nearest smaller element 계산하기 
# n개의 정수가 주어지면 각 정수보다 작은 값 중 가장 작은 값을 구하는 문제 

# sol 1
A = [1,3,4,2,5,3,4,2]
B = []
n = len(A)
for i in range(n) : 
    j = i-1
    while j >= 0 : 
        if A[j] < A[i] : 
            break
        j = j-1
    B.append(A[j])
print(B)
    
# sol - 2







[2, 1, 3, 1, 2, 2, 3, 1]


In [4]:
# queue in python 

# queue 직접 구현 
class Queue : 
    def __init__(self) -> None:
        self.items = []
        self.front_index = 0 
    
    def enqueue(self,val) : 
        self.items.append(val)
        # 이론상 수행시간 O(len(A))
        # 평균 O(1)
    
    def dequeue(self,val) : 
        if self.front_index == len(self.itmes) : 
            print("empty")
            return None 
        else : 
            x = self.item[self.front_index]
            self.front_index += 1
            return x 

In [5]:
from collections import deque


q = Queue()
q.enqueue(1)
q.enqueue(2)
q.enqueue(3)
q.dequeue

<bound method Queue.dequeue of <__main__.Queue object at 0x000002305B28AD60>>

In [6]:
# collections에서 제공하는 dequeu 사용하기 
# collectons.deque : 양방향 데이터 처리 가능 
from collections import deque
dq = deque([])
dq.append(1)
dq.append(2)
dq.append(3)
print(dq)


deque([1, 2, 3])


#### queue 사용 예

1. josephus game 
- 1번부터 n번까지의 원형 테이블에서 1번부터 시작해서 k번째 사람이 탈락하는 게임 

## 3.  Linked_List

연결 리스트
 - 리스트와는 다른 개념 
 - 연결 리스트는 node가 link에 의해 기차처럼 연결된 순차 자료구조로 링크를 따라 원하는 노드의 데이터를 접근하고 수정함 

 연결 리스트는 node, data, link로 구성되어 있음 

 singly linked list (한방향 연결리스트)

 - 노드들이 한 쪽 방향으로만 연결된 리스트 
 head - node - node - none


한방향 연결 리스트와 배열 리스트의 장단점 비교 

배열 리스트 : 동일한 데이터 타입을 연석족으로 저장하여 간단하고 사용하기 쉽다. 
고정된 크기를 가지고 있어서 배열의 처음이나 중간에서 원소를 넣고 빼려면 많은 연산을 해야한다. (모든 )

장점 : 

단점 : 

연산의 시간복잡도 


 


In [1]:
## node class 
class Node : 
    def __init__(self, key = None, value = None) -> None:
        self.key = key
        self.value = value 
        self.next = None 

    def __str__(self) -> str:
        return str(self.key)

In [1]:
class SinglyLinkedList : 
    def __init__(self) -> None:
        self.head = None
        self.size = 0
    
    ## generator
    def __iter__(self) : 
        v = self.head
        while v != None : 
            yield v
    ## print 
    def __str__(self) : 
        return " -> ".join(str(v) for v in self)

    ## len 
    def __len__(self) : 
        return self.size 

    ## method 

    ## pushFront : 입력받은 key값을 LinkedList 가장 앞에 삽입함
    ## tc : O(1)
    def pushFront(self,key,value = None) :  
        new_node = Node(key,value)
        new_node.next = self.head
        self.head = new_node
        self.size += 1
    
    ## pushBack : 입력받은 key값을 LinkedList 가장 뒤에 삽입함
    ## tc : O(n)
    def pushBack(self,key,value = None) : 
        new_node = Node(key,value)
        # linkedlist가 비어있는 경우 
        if self.size == 0 : 
            self.head = new_node
        
        # linkedlist가 비어있지 않은 경우 
        else : 
            tail = self.head
            while tail.next != None : 
                tail = tail.next
            tail.next = new_node
        self.size += 1

    ## popFront 

    ## popBack 

    ## search

    ## remove

    def find_kth_ndoe_from_tail(L,K) :    
         


## find_kth_node_from_tail(L,K) : 

## find_middle_node(L)


##### 양방향 연결 리스트 (doubly linekd list)

한방향 리스트의 결정적 단점은 뒤로 가는 링크만 있다는 것  

노드가 많을경우 탐색시 모든 노드를 다 찾아야 한다. 

양방향 연결 리스트는 위 단점을 보안하여 앞으로 가는 링크와 뒤로 가는 링크가 모두 존재  

양방향 연결 리스트는 첫 노드와 마지막 노드가 연결된 원형 리스트  

양방향 연결 리스트의 첫 노드는 dummy 노드로 리스트의 처음을 알리는 역할을 한다. 

In [1]:
## doubly linked list
class Node_v2 : 
    def __init__(self,key = None) -> None:
        self.key = key
        self.next = self.prev = self 

    def __str__(self) : 
        return str(self.key)

In [1]:
class DoublyLinkedList : 
    def __init__(self) -> None:
        self.head = Node()
        self.size = 0
    
    def __iter__(self) : 
        v = self.head
        while v != None : 
            yield v
        
    def __str__(self) : 
        return " -> ".join(str(v) for v in self)
    
    def __len(self) : 
        return self.size 

    # tc : O(n)
    def search(self,key) : 
        node = self.head.next
        while node.key : 
            if node.key == key : 
                return node
            node = node.next
        return None
    
    # 빈리스트인지 확인 (self.size를 통해 확인해도 됨)
    def isEmpty(self) : 
        if self.head.next == self.head : 
            return True
        return False
    
    # 첫번째 노드 리턴 
    def first(self,key) : 
        if self.isEmpty() : 
            return None
        return self.head.next

    # 마지막 노드 리턴
    def last(self,key) : 
        if self.isEmpty() : 
            return None
        return self.head.prev

    
    # 노드 a부터 b까지 떼어내서 붙이는 연산 
    # a와 b가 동일하너간 a 다음에 b가 나타나야 함 
    # head와 x는 a와 b 사이에 포함되면 안됨 -> head가 
    # splice를 통해 이동, 삽입 연산 모두 가능함 

    # splice는 6개의 link를 고치는 함수로 시간복잡도는 O(1)
    def splice(self,a,b,x) : 
        if a == None or b == None or x == None : 
            return
        ap = a.prev
        bn = b.next

        # 자르기     
        ap.next = bn
        bn.prev = ap
        
        # 붙이기 
        xn = x.next
        xn.prev = b
        b.next = xn
        a.prev = x
        x.next = a
    
    # 밑에 모든 함수는 splice를 이용하는데 splice의 시간복잡도가 O(1)임으로
    # 아래 함수 또한 시간복잡도는 O(1)이다.  
    # moveAfter / moveBefore : 
    # insertAfter / insertBefore : 
    # pushBack / pushFront : 


    # tc : O(1)
    def remove(self,x) : 
        if x == None or x == self.head : 
            return 
        # x 때어내기 
        x.prev.next, x.next.prev = x.next, x.prev
    # tc : O(1)
    def popFront(self) : 
        if self.isEmpty() : return None
        key = self.head.next.key
        self.remove(self.head.next)
        return key
    # tc : O(1)
    def popBack(self) : 
        if self.isEmpty() : return None
        key = self.head.prev.key
        self.remove(self.head.prev)
        return key 
    # tc : O(1)
    def join(self,another_list) :
        if another_list.isEmpty() : return 

        self.head.prev.next = another_list.head.next
        another_list.head.next.prev = self.head.prev

        self.head.prev = another_list.head.prev
        another_list.head.prev.next = self.head
    # tc : O(1)
    def split(self,x) : 
        if self.size == 0 : return 
        elif self.size == 1 : return 
        else : 
            x.prev.next = self.head
            x.next.prev = self.prev
            self.head.prev = x.prev
            self.head.prev.next = x.next
        

양방향 연결 리스트의 장단점

In [2]:
# Josephus 

## 4. Hash Table 

매우 빠른 평균 삽입, 삭제 ,탐색연산 제공 

hash fuction : key값이 저장될 주소를 계산하는 함수 

hash function 종류 
- perfct : 충돌없이 1 ; 1로 매핑하는 해시함수 
- c-universal 

key값이 
- division
- multiplication 
- folding 
- mid-square
- extraction 

key 값이 문자열인 경우
- additive hash
- rotating hash 
- universal hash 

충돌(collision) : hash_function의 값이 같은 경우 

충돌 해결 방법 (collision resolution methods) 
서로 다른 key값에 대해 충돌이 발생한 경우 저장하는 방법 
1. open addressing : 충돌이 발생한 경우 빈 슬롯이 나올 때 까지 
2. chaining : 


좋은 hash function의 조건 
1. 빠른 계산 
2. 적은 충돌 

삽입 연산 