### 배열(Array)

- 데이터를 나열하고, 각 데이터를 인덱스에 대응하도록 구성한 데이터 구조
- 파이썬에서는 리스트 타입이 배열 기능을 제공하고 있음

## 1. 배열이 필요한 이유

- 같은 종류의 데이터를 효율적으로 관리하기 위해 사용
- 같은 종류의 데이터를 순차적으로 저장

- 배열의 장점:
    - 빠른 접근 가능
- 배열의 단점:
    - 추가/삭제가 쉽지 않음
    - 미리 최대 길이를 지정해야 함

## 2. 파이썬과 C언어의 배열 예제

In [None]:
# c 언어

int main(int argc, char * argv[])
{
    char country[3] = "US"
    printf("%c%c\n", country[0], country[1]);
    printf("%s\n", country);
    return 0;    
}

In [2]:
country = 'US'
print(country)

country = country + 'A'
print(country)

US
USA


## 3. 파이썬과 배열
- 파이썬 리스트 활용

In [3]:
# 1차원 배열: 리스트로 구현시
data = [1, 2, 3, 4, 5]
print(data)

[1, 2, 3, 4, 5]


In [5]:
# 2차원 배열 리스트로 구현시
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
data

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [6]:
print(data[0])

[1, 2, 3]


In [7]:
print(data[0][0])
print(data[1][0])

1
4


## 4. 프로그래밍 연습

#### 연습 1. 이름들이 들어있는 리스트에서 M이 총 몇번 나오는지 카운팅하기

In [None]:
m_count = 0
for data in dataset:
    for idx in range(len(data)):
        if data[idx] == 'M':
            m_count += 1
print(m_count)

## 5. Queue library 사용 및 구현

#### 일반적인 queue library

In [10]:
import queue

data_queue = queue.Queue()

In [11]:
data_queue.put("funcoding")
data_queue.put(1)

In [12]:
data_queue.qsize()

2

In [13]:
data_queue.get()

'funcoding'

In [14]:
data_queue.qsize()

1

In [15]:
data_queue.get()

1

#### lifo queue library

In [17]:
import queue
data_queue = queue.LifoQueue()

In [19]:
data_queue.put("funcoding")
data_queue.put(1)

In [20]:
data_queue.qsize()

2

In [21]:
data_queue.get()

1

#### priority queue library

In [23]:
import queue

data_queue = queue.PriorityQueue()

In [24]:
data_queue.put((10, "Korea"))
data_queue.put((12, "USA"))
data_queue.put((5, 1))

In [25]:
data_queue.qsize()

3

In [26]:
data_queue.get()

(5, 1)

#### enque, dequeue 구현하기

In [28]:
queue_list = list()

def enqueue(data):
    queue_list.append(data)
    
def dequeue():
    data = queue_list[0]
    del queue_list[0]
    return data

In [29]:
for idx in range(10):
    enqueue(idx)

In [30]:
len(queue_list)

10

In [33]:
dequeue()

2

## 6. Stack library 사용 및 구현

In [1]:
# 재귀 함수
def recursive(data):
    if data < 0:
        print("ended")
    else:
        print(data)
        recursive(data - 1)
        print("returned", data)

In [3]:
recursive(4)

4
3
2
1
0
ended
returned 0
returned 1
returned 2
returned 3
returned 4


In [4]:
data_stack = list()

data_stack.append(1)
data_stack.append(2)

In [5]:
data_stack

[1, 2]

In [6]:
data_stack.pop()

2

In [7]:
data_stack

[1]

## push, pop 구현하기

In [16]:
stack_list = list()

def push(data):
    stack_list.append(data)

def pop():
    data = stack_list[-1]
    del stack_list[-1]
    return data

In [17]:
for idx in range(10):
    push(idx)

In [18]:
pop()

9

## 7. queue, stack 의 장단점

## Stack
- 장점
    - 구조가 단순하여 구현이 쉬움
    - 데이터 저장/읽기 속도 빠름
- 단점(일반적인 스택 구현시)
     - 데이터 최대 갯수를 미리 정해야 함
        - 파이썬의 경우 재귀함수는 1000번까지만 호출 가능
    - 저장 공간의 낭비 가능성
        - 미리 최대 갯수만큼 저장 공간 확보 필요
    - 대표적인 활용
        - 컴퓨터 내부의 프로세스 구조의 함수 동작 방식
        - 재귀 함수의 경우에도 stack 방식으로 재귀 함수를 쌓아놓았다가, 마지막에 호출된 재귀 함수 부터 실행 된다.
        
## Queue
- 장단점 보다는 멀티 태스킹을 위한 프로세스 스케쥴링 방식을 구현하기 위해 많이 사용됨

## 8. Linked List

#### Node 구현

In [22]:
class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

In [23]:
class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next

#### Node와 Node 연결하기 (포인터 활용)

In [25]:
node1 = Node(1)
node2 = Node(2)
node1.next = node2
head = node1

#### 링크드 리스트로 데이터 추가하기

In [27]:
class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next
        
def add(data):
    node = head
    while node.next:
        node = node.next        
    node.next = Node(data)

In [28]:
node1 = Node(1)
head = node1
for idx in range(2, 10):
    add(idx)    

#### 링크드 리스트 데이터 출력하기(검색하기)

In [29]:
node = head
while node.next:
    print(node.data)
    node = node.next
print(node.data)

1
2
3
4
5
6
7
8
9


#### node들 사이에 데이터 넣기

In [30]:
node3 = Node(1.5)

In [31]:
node = head
search = True
while search:
    if node.data == 1:
        search = False
    else:
        node = node.next
        
node_next = node.next
node.next = node3
node3.next = node_next

In [32]:
node = head
while node.next:
    print(node.data)
    node = node.next
print(node.data)

1
1.5
2
3
4
5
6
7
8
9


#### 파이썬 객체지향 프로그래밍으로 링크드 리스트 구현하기

In [40]:
class Node:
    
    def __init__(self, data, next=None):
        self.data = data
        self.next = next
    
    
class NodeMgmt:
    
    def __init__(self, data):
        self.head = Node(data)
    
    def add(self, data):
        if self.head == "":
            self.head = Node(data)
        else:
            node = self.head
            while node.next:
                node = node.next
            node.next = Node(data)            

    # 노드의 전체 데이터 출력
    def desc(self):
        node = self.head
        while node:
            print(node.data)
            node = node.next
            
    def delete(self, data):
        if self.head == "":
            print("해당 값을 가진 노드가 없습니다.")
            return
        
        if self.head.data == data:
            temp = self.head
            self.head = self.head.next
            del temp
        else:
            node = self.head
            while node.next:
                if node.next.data == data:
                    temp = node.next
                    node.next = node.next.next
                    del temp
                    return
                else:
                    node = node.next
                    
    # 특정한 값을 가진 노드 찾기
    def search_node(self, data):
        node = self.head
        while node:
            if node.data == data:
                return node
            else:
                node = node.next

#### 링크드 리스트 테스트

In [41]:
linked_list1 = NodeMgmt(0)
linked_list1.desc()

0


In [45]:
linked_list1.head

In [44]:
linked_list1.delete(0)

In [46]:
linked_list1 = NodeMgmt(0)
linked_list1.desc()

0


In [47]:
for data in range(1, 10):
    linked_list1.add(data)
linked_list1.desc()

0
1
2
3
4
5
6
7
8
9


In [48]:
linked_list1.delete(4)
linked_list1.desc()

0
1
2
3
5
6
7
8
9


In [49]:
linked_list1.delete(9)
linked_list1.desc()

0
1
2
3
5
6
7
8


#### 더블 링크드 리스트

In [72]:
class Node:
    def __init__(self, data, prev=None, next=None):
        self.prev = prev
        self.data = data
        self.next = next
        
class NodeMgmt:
    def __init__(self,data):
        self.head = Node(data)
        self.tail = self.head
        
    def insert(self, data):
        if self.head == None:
            self.Node(data)
            self.tail = self.head
        else:
            node = self.head
            while node.next:
                node = node.next
            new = Node(data)
            node.next = new
            new.prev = node
            self.tail = new
            
    def desc(self):
        node = self.head
        while node:
            print(node.data)
            node = node.next
            
    def search_from_head(self, data):
        if self.head == None:
            return False
        
        node = self.head
        while node:
            if node.data == data:
                return node
            else:
                node = node.next
        return False
    
    def search_from_tail(self, data):
        if self.head == None:
            return False
        
        node = self.head
        while node:
            if node.data == data:
                return node
            else:
                node = node.prev
        return False
    
    # 특정 노드 앞에 데이터 넣기
    def insert_before(self, data, before_data):
        if self.head == None:
            self.head = Node(data)
            return True
        else:
            node = self.tail
            while node.data != before_data:
                node = node.prev
                if node == None:
                    return False
            new = Node(data)
            before_new = node.prev
            before_new.next = new
            new.next = node
            new.prev = before_new
            node.prev = new
            return True
            

In [73]:
double_linked_list = NodeMgmt(0)
for data in range(1, 10):
    double_linked_list.insert(data)
double_linked_list.desc()

0
1
2
3
4
5
6
7
8
9


In [76]:
node3 = double_linked_list.search_from_head(3)
if node3:
    print(node3.data)
else:
    print("No data")

3


In [75]:
double_linked_list.insert_before(1.5, 2)
double_linked_list.desc()

0
1
1.5
1.5
2
3
4
5
6
7
8
9


## 9. 시간 복잡도

O(1) < O(logn) < O(n) < O(nlogn) < O(n^2) < O(2^n) < O(n!)

In [77]:
# 1부터 n까지의 합을 구하는 알고리즘의 시간 복잡도
# n번 만큼 돌게 됨으로 O(n)
def sum_all(n):
    total = 0
    for num in range(1, n + 1):
        total += num
    return total

In [79]:
sum_all(100)

5050

In [82]:
# 1부터 n까지의 합을 구하는 다른 알고리즘의 시간 복잡도
# 무조건 한 번(상수 번) 실행됨으로 O(1)
def sum_all(n):
    return int(n * (n + 1) / 2)

In [83]:
sum_all(100)

5050

## 10. Hash Table

#### 간단한 Hash Table 만들기

In [33]:
hash_table = list([i for i in range(10)])
print(hash_table)
print(type(hash_table))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
<class 'list'>


In [34]:
hash_table = [i for i in range(10)]
print(hash_table)
print(type(hash_table))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
<class 'list'>


#### 초간단 해쉬 함수 만들기
- 가장 간단한 방식은 Division 법(나누기를 통한 나머지 값을 사용하는 기법)

In [5]:
def hash_func(key):
    return key % 5

#### 해쉬테이블에 저장하기

- 데이터에 따라 필요시 key 생성 방법 정의가 필요함

In [9]:
data1 = "Andy"
data2 = "Dave"
data3 = "Trump"

# ord(): 문자의 ASCII(아스키)코드 리턴
# 우측 하단의 hash_func를 통해 나온 값이 해쉬 주소가 됨
print(ord(data1[0]), ord(data2[0]), ord(data3[0]))
print(ord(data1[0]), hash_func(ord(data1[0])))

65 68 84
65 0


In [10]:
def store_data(data, value):
    key = ord(data[0])
    hash_address = hash_func(key)
    hash_table[hash_address] = value

In [11]:
store_data("Andy", "0105111514816")
store_data("Dave", "010512551216")
store_data("Trump", "01004984798151")


In [15]:
def get_data(data):
    key = ord(data[0])
    hash_address = hash_func(key)
    return hash_table[hash_address]

In [17]:
get_data("Ally")

'0105111514816'

#### 해쉬 함수 연습

In [18]:
# 파이썬 라이브러리로 해쉬 키 생성
hash("Dave")

6828976459122451299

In [19]:
hash_table = list([0 for i in range(8)])

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    hash_address = hash_function(get_key(data))
    hash_table[hash_address] = value
    
def read_data(data):
    hash_address = hash_function(get_key(data))
    return hash_table[hash_address]

In [20]:
save_data("Dave", "015644874635")
save_data("Andy", "011252152")
read_data("Dave")

'015644874635'

In [21]:
hash_table

[0, 0, 0, '015644874635', 0, 0, '011252152', 0]

#### 해쉬 충돌(해쉬 주소값 중복) 해결 알고리즘

-  chaining 기법
    - 개방 해슁 : 해쉬 테이블 저장공간 외의 공간을 활용하는 기법
    - 충돌이 일어날 경우 링크드 리스트를 사용하여 충돌이 일어난 주소값에 데이터를 추가로 뒤에 연결시켜 저장

In [53]:
hash_table = [0 for i in range(8)]

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    # 동일 키 값에서 어떤 해쉬 값을 가지고 있는지 구분하기 위함
    idx_key = get_key(data)
    hash_address = hash_function(idx_key)
    
    # 데이터가 들어있는지 확인
    # 링크드 리스트를 사용하지 않고 파이썬의 리스트로도 구현 가능(그러나 단순 리스트는 최대 크기가 지정이 되어있고, 
    # 충돌 수에 따라 동적으로 리스트 수를 만들 수 없다는 단점이 있음)
    if hash_table[hash_address] != 0:
        for idx in range(len(hash_table[hash_address])):
            if hash_table[hash_address][idx][0] == idx_key:
                hash_table[hash_address][idx][1] = value
                return
            hash_table[hash_address].append([idx_key, value])
    else:
        hash_table[hash_address] = [[idx_key, value]]
    
def read_data(data):
    idx_key = get_key(data)
    hash_address = hash_function(idx_key)
    if hash_table[hash_address] != 0:
        for idx in range(len(hash_table[hash_address])):
            if hash_table[hash_address][idx][0] == idx_key:
                return hash_table[hash_address][idx][1]
        return None
    
    else:
        return None
    
    return hash_table[hash_address]

In [54]:
print(hash("Dd") % 8)
print(hash("Data") % 8)

7
7


In [55]:
save_data("Dd", "Dave1")
save_data("Data", "Dave3")
read_data("Dd")

'Dave1'

In [56]:
hash_table

[0,
 0,
 0,
 0,
 0,
 0,
 0,
 [[9106254936569821975, 'Dave1'], [1928565448814304871, 'Dave3']]]

-  Linear Probing 기법
    - 폐쇄 해슁 : 해쉬 테이블 저장공간 안에서 충돌 문제를 해결하는 기법
    - 충돌이 일어날 경우 해당 hash address의 다음 address 부터 맨 처음 나오는 빈공간에 저장하는 기법
        - 저장공간 활용도를 높이기 위한 기법

In [None]:
hash_table = [0 for i in range(8)]

def get_key(data):
    return hash(data)

def hash_function(key):
    return key % 8

def save_data(data, value):
    # 동일 키 값에서 어떤 해쉬 값을 가지고 있는지 구분하기 위함
    idx_key = get_key(data)
    hash_address = hash_function(idx_key)
    
    if hash_table[hash_address] != 0:
         # hash address의 다음 address 부터 맨 처음 나오는 빈공간에 저장하도록 하기
        for idx in range(hash_address, len(hash_table)):
            if hash_table[idx] == 0:
                hash_table[idx] = [idx_key, value]
                return
            # 키가 동일한 값이 이미 해쉬 테이블에 있을 경우 기존 값 변경
            elif hash_table[idx][0] == idx_key:
                hash_table[idx][1] = value
                return
    else:
        hash_table[hash_address] = [idx_key, value]
        
def read_data(data):
    idx_key = get_key(data)
    hash_address = hash_function(idx_key)
    if hash_table[hash_address] != 0:
        for idx in range(hash_address, len(hash_table)):
            # 빈 슬롯이 나타났다는 것은 해당 키 값이 저장되지 않았음을 의미
            if hash_table[idx] == 0:
                return None
                
            elif hash_table[idx][0] == idx_key:
                return hash_table[idx][1]
        
    else:
        return None

In [58]:
print(hash("Dd") % 8)
print(hash("Data") % 8)

7
7


In [61]:
save_data("Dd", "gazua")
save_data("Da", "gazua123")
read_data("Dd")

'gazua'

#### 빈번한 충돌을 개선하는 기법
- 해쉬 함수를 재정의 및 해쉬 테이블 저장 공간 확대

#### 참고 : 해쉬 함수와 키 생성 함수
- 파이썬의 hash()함수는 실행할 때 마다 값이 달라질 수 있음
- 유명한 해쉬 함수 : SHA(Secure Hash Algorithm, 안전한 해시 알고리즘)
    - 어떤 데이터도 유일한 고정된 크기의 고정값을 리턴해줌으로, 해쉬 함수로 유용하게 활용 가능

#### SHA-1

In [67]:
import hashlib

# "test".encode() 는 b"test"와 동일
data = "test".encode()
hash_object = hashlib.sha1()
hash_object.update(data)
# 16 진수로 변환
hex_dig = hash_object.hexdigest()
print(hex_dig)

a94a8fe5ccb19ba61c4c0873d391e987982fbbd3


#### SHA-256

In [68]:
import hashlib

# "test".encode() 는 b"test"와 동일
data = "test".encode()
hash_object = hashlib.sha256()
hash_object.update(data)
# 16 진수로 변환
hex_dig = hash_object.hexdigest()
print(hex_dig)

9f86d081884c7d659a2feaa0c55ad015a3bf4f1b2b0b822cd15d6c15b0f00a08


#### chaining 기법을 적용한 해쉬 테이블 코드에 키 생성 함수를 sha256 해쉬 알고리즘을 사용하도록 변경해보기

In [72]:
import hashlib

hash_table = [0 for i in range(8)]

def get_key(data):
    hash_object = hashlib.sha256()
    hash_object.update(data.encode())
    hex_dig = hash_object.hexdigest()
    # hex_dig의 문자열을 16진수의 int로 변환
    return int(hex_dig, 16)

def hash_function(key):
    return key % 8

def save_data(data, value):
    # 동일 키 값에서 어떤 해쉬 값을 가지고 있는지 구분하기 위함
    idx_key = get_key(data)
    hash_address = hash_function(idx_key)
    
    # 데이터가 들어있는지 확인
    # 링크드 리스트를 사용하지 않고 파이썬의 리스트로도 구현 가능(그러나 단순 리스트는 최대 크기가 지정이 되어있고, 
    # 충돌 수에 따라 동적으로 리스트 수를 만들 수 없다는 단점이 있음)
    if hash_table[hash_address] != 0:
        for idx in range(len(hash_table[hash_address])):
            if hash_table[hash_address][idx][0] == idx_key:
                hash_table[hash_address][idx][1] = value
                return
            hash_table[hash_address].append([idx_key, value])
    else:
        hash_table[hash_address] = [[idx_key, value]]
    
def read_data(data):
    idx_key = get_key(data)
    hash_address = hash_function(idx_key)
    if hash_table[hash_address] != 0:
        for idx in range(len(hash_table[hash_address])):
            if hash_table[hash_address][idx][0] == idx_key:
                return hash_table[hash_address][idx][1]
        return None
    
    else:
        return None
    
    return hash_table[hash_address]

In [73]:
print(get_key('db')%8)
print(get_key('da')%8)
print(get_key('dh')%8)

1
2
2


#### hash의 시간 복잡도
- 일반적인 경우(collision이 없는 경우)는 O(1)
- 최악의 경우(collision이 매번 발생한는 경우)는 O(n)
- 해쉬 테이블의 경우, 일반적인 경우를 기대하고 만들기 때문에, 시간 복잡도는 O(1)이라고 말할 수 있음
- 16개의 배열에 데이터를 저장하고 검색하면 O(n), 16개의 데이터 저장 공간을 가진 해쉬 테이블에 데이터를 저장하고 검색하면 O(1)
    - 해쉬 테이블이 배열보다 효율적임


## 11. Tree

In [3]:
# 노드 클래스 만들기
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

In [11]:
# 이진 탐색 트리에 데이터 넣기
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value:
                if self.current_node.left:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
                    
    def search(self, value):
        self.currnet_node = self.head
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False

In [12]:
head = Node(1)
BST = NodeMgmt(head)
BST.insert(2)
BST.insert(3)
BST.insert(0)
BST.insert(4)
BST.insert(8)

In [14]:
BST.search(10)

False

#### 이진 탐색 트리 삭제
- 매우 복잡하여 경우를 나눠 생각하는 것이 좋음

- leaf node 일 때(하위 노드가 없을 때)
    = 삭제할 Node의 Parent Node가 삭제할 Node를 가리키지 않도록 한다.

- 하위 노드가 한개 일 때
    - 삭제할 Node의 Parent Node가 삭제할 Node의 Child Node를 가리키도록 한다.

- 하위 노드가 두개 일 때
    - 아래 두 방법 중 하나를 사용하면 됨
        1. 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
        2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.

##### 1,  삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키게 할 경우
    - 삭제할 Node의 오른쪽 자식 선택
    - 오른쪽 자식의 가장 왼쪽에 있는 Node를 선택
    - 해당 Node를 삭제할 Node의 Parent Node의 왼쪽 Branch가 가리키게 함
    - 해당 Node의 왼쪽 Branch가 삭제할 Node의 왼쪽 Child Node를 가리키게 함
    - 해당 Node의 오른쪽 Brach가 삭제할 Node의 오른쪽 Child Node를 가리키게 함
    - 만약 해당 Node가 오른쪽 Child Node를 가지고 있었을 경우에는, 해당 Node의 본래 Parent Node의 왼쪽 Branch가 해당 오른쪽 Child Node를 가리키게함

#### 1.1 삭제할 Node 탐색
    - 삭제할 Node가 없는 경우도 처리해야 함
        - 이를 위해 삭제할 Node가 없는 경우는 False를 리턴하고, 함수를 종료시킴

In [None]:
# def delete(self, value):
    # 모든 노드를 순회하며 검색
    searched = False
    # current_node는 삭제할 node를 지칭
    self.current_node = self.head
    # parent node는 삭제할 node의 부모 node를 지칭
    self.parent = self.head
    
    while self.current_node:
        if self.current_node.value == value:
            searched = True
            break
        elif value < self.current_node.value:
            self.parent = self.current_node
            self.current_node = self.current_node.left
        else:
            self.parent = self.current_node
            self.current_node = self.current_node.right
    
    # 삭제할 노드가 없을 경우
    if searched == False:
        return False
            